uDocumentViewer
Données et configuration.parquet

Parquet visionneuse

prêt
À propos de Parquet

Format de données colonnaire Apache.

Parquet est le format analytique colonnaire moderne — le stockage adossé pour Spark, Athena, DuckDB, les tables externes BigQuery et le hub datasets Hugging Face. hyparquet le décode directement dans le navigateur sans WebAssembly, lisant d'abord les métadonnées du footer puis matérialisant uniquement les lignes demandées. Nous échantillonnons les 1 000 premières lignes pour qu'un fichier multi-gigaoctets s'ouvre instantanément, exposons le schéma de colonnes feuilles avec types logiques et modes de répétition, et vous permettez d'exporter l'échantillon en JSON. Les valeurs imbriquées (listes, structs, maps) sont rendues en JSON compact ; les colonnes binaires sont résumées par longueur en octets.

FAQ
Qu'est-ce qu'un fichier Parquet ?
Apache Parquet est un format colonnaire disque optimisé pour les requêtes analytiques. Les données sont partitionnées en row groups, chaque row group en column chunks, chaque chunk en pages — donc les moteurs peuvent lire uniquement les colonnes dont ils ont besoin.
Pourquoi seulement 1 000 lignes ?
Les fichiers Parquet atteignent régulièrement des centaines de millions de lignes. Nous matérialisons un échantillon pour que le viewer reste réactif ; le nombre de lignes dans la barre d'outils affiche le vrai total depuis les métadonnées du footer.
Gère-t-il les types imbriqués ?
Oui. Listes, structs et maps font un aller-retour à travers hyparquet et nous les rendons en JSON compact. Décimaux, dates et timestamps apparaissent avec leur annotation de type logique dans l'onglet Schéma.
Mon fichier est-il téléversé ?
Non. Les octets sont parsés localement dans votre navigateur ; le fichier ne quitte jamais votre appareil.
Fonctionne-t-il sur mobile ?
Oui. Le tableau de résultats défile horizontalement avec un index de ligne collant, et la vue schéma s'empile proprement sur écrans étroits.
Plus de Données et configuration