Données et configuration.parquet
Parquet visionneuse
À propos de Parquet
Format de données colonnaire Apache.
Parquet est le format analytique colonnaire moderne — le stockage adossé pour Spark, Athena, DuckDB, les tables externes BigQuery et le hub datasets Hugging Face. hyparquet le décode directement dans le navigateur sans WebAssembly, lisant d'abord les métadonnées du footer puis matérialisant uniquement les lignes demandées. Nous échantillonnons les 1 000 premières lignes pour qu'un fichier multi-gigaoctets s'ouvre instantanément, exposons le schéma de colonnes feuilles avec types logiques et modes de répétition, et vous permettez d'exporter l'échantillon en JSON. Les valeurs imbriquées (listes, structs, maps) sont rendues en JSON compact ; les colonnes binaires sont résumées par longueur en octets.
FAQ
- Qu'est-ce qu'un fichier Parquet ?
- Apache Parquet est un format colonnaire disque optimisé pour les requêtes analytiques. Les données sont partitionnées en row groups, chaque row group en column chunks, chaque chunk en pages — donc les moteurs peuvent lire uniquement les colonnes dont ils ont besoin.
- Pourquoi seulement 1 000 lignes ?
- Les fichiers Parquet atteignent régulièrement des centaines de millions de lignes. Nous matérialisons un échantillon pour que le viewer reste réactif ; le nombre de lignes dans la barre d'outils affiche le vrai total depuis les métadonnées du footer.
- Gère-t-il les types imbriqués ?
- Oui. Listes, structs et maps font un aller-retour à travers hyparquet et nous les rendons en JSON compact. Décimaux, dates et timestamps apparaissent avec leur annotation de type logique dans l'onglet Schéma.
- Mon fichier est-il téléversé ?
- Non. Les octets sont parsés localement dans votre navigateur ; le fichier ne quitte jamais votre appareil.
- Fonctionne-t-il sur mobile ?
- Oui. Le tableau de résultats défile horizontalement avec un index de ligne collant, et la vue schéma s'empile proprement sur écrans étroits.
Plus de Données et configuration
- .jsonJSONJavaScript Object Notation — données structurées.Ouvrir
- .csvCSVValeurs séparées par des virgules — données tabulaires.Ouvrir
- .tsvTSVValeurs séparées par tabulations — données tabulaires.Ouvrir
- .xmlXMLExtensible Markup Language.Ouvrir
- .yamlYAMLFormat de config/données lisible.Ouvrir
- .tomlTOMLConfig Tom's Obvious Minimal Language.Ouvrir
- .iniINIFichiers de config clé=valeur classiques.Ouvrir
- .dbSQLiteFichier base de données .db / .sqlite.Ouvrir