uDocumentViewer
Daten & Konfiguration.parquet

Parquet Viewer

verfügbar
Über Parquet

Apache Spalten-Datenformat.

Parquet ist das moderne spaltenorientierte Analytics-Format — der Backing-Storage für Spark, Athena, DuckDB, BigQuery External Tables und den Hugging-Face-Datensätze-Hub. hyparquet dekodiert es direkt im Browser ohne WebAssembly, indem es zuerst die Footer-Metadaten liest und dann nur die Zeilen materialisiert, nach denen du fragst. Wir sampeln die ersten 1.000 Zeilen, sodass eine Multi-Gigabyte-Datei sofort öffnet, zeigen das Leaf-Spalten-Schema mit logischen Typen und Repetition-Modi und lassen dich das Sample als JSON exportieren. Verschachtelte Werte (Listen, Structs, Maps) werden als kompaktes JSON gerendert; binäre Spalten werden nach Byte-Länge zusammengefasst.

FAQ
Was ist eine Parquet-Datei?
Apache Parquet ist ein spaltenorientiertes On-Disk-Format, optimiert für analytische Abfragen. Daten sind in Row-Groups partitioniert, jede Row-Group in Column-Chunks, jeder Chunk in Pages — sodass Engines nur die Spalten lesen können, die sie brauchen.
Warum nur 1.000 Zeilen?
Parquet-Dateien erreichen routinemäßig hunderte Millionen Zeilen. Wir materialisieren ein Sample, damit der Viewer reaktionsschnell bleibt; die Zeilenzahl in der Toolbar zeigt die tatsächliche Summe aus den Footer-Metadaten.
Kommt es mit verschachtelten Typen klar?
Ja. Listen, Structs und Maps durchlaufen hyparquet und wir rendern sie als kompaktes JSON. Dezimalzahlen, Daten und Zeitstempel erscheinen mit ihrer logischen Typ-Annotation im Schema-Tab.
Wird meine Datei hochgeladen?
Nein. Die Bytes werden lokal in deinem Browser geparst; die Datei verlässt dein Gerät nicht.
Funktioniert das auf Mobilgeräten?
Ja. Die Ergebnistabelle scrollt horizontal mit fixiertem Zeilen-Index, und die Schema-Ansicht stapelt sich sauber auf schmalen Viewports.
Mehr aus Daten & Konfiguration