Question 1

Was ist eine Parquet-Datei?

Accepted Answer

Apache Parquet ist ein spaltenorientiertes On-Disk-Format, optimiert für analytische Abfragen. Daten sind in Row-Groups partitioniert, jede Row-Group in Column-Chunks, jeder Chunk in Pages — sodass Engines nur die Spalten lesen können, die sie brauchen.

Question 2

Warum nur 1.000 Zeilen?

Accepted Answer

Parquet-Dateien erreichen routinemäßig hunderte Millionen Zeilen. Wir materialisieren ein Sample, damit der Viewer reaktionsschnell bleibt; die Zeilenzahl in der Toolbar zeigt die tatsächliche Summe aus den Footer-Metadaten.

Question 3

Kommt es mit verschachtelten Typen klar?

Accepted Answer

Ja. Listen, Structs und Maps durchlaufen hyparquet und wir rendern sie als kompaktes JSON. Dezimalzahlen, Daten und Zeitstempel erscheinen mit ihrer logischen Typ-Annotation im Schema-Tab.

Question 4

Wird meine Datei hochgeladen?

Accepted Answer

Nein. Die Bytes werden lokal in deinem Browser geparst; die Datei verlässt dein Gerät nicht.

Question 5

Funktioniert das auf Mobilgeräten?

Accepted Answer

Ja. Die Ergebnistabelle scrollt horizontal mit fixiertem Zeilen-Index, und die Schema-Ansicht stapelt sich sauber auf schmalen Viewports.

Parquet Viewer

Parquet-Dateien öffnen

Parquet-Dateien öffnen