uDocumentViewer
Datos y configuración.parquet

Parquet visor

listo
Acerca de Parquet

Formato columnar de Apache.

Parquet es el formato columnar moderno para analítica — el almacenamiento de Spark, Athena, DuckDB, las tablas externas de BigQuery y el hub de datasets de Hugging Face. hyparquet lo decodifica directamente en el navegador sin WebAssembly, leyendo primero los metadatos del footer y materializando solo las filas que pidas. Muestreamos las primeras 1.000 filas para que un archivo de varios gigabytes se abra al instante, mostramos el esquema de columnas hoja con tipos lógicos y modos de repetición, y te dejamos exportar la muestra como JSON. Los valores anidados (listas, structs, maps) se renderizan como JSON compacto; las columnas binarias se resumen por longitud en bytes.

Preguntas frecuentes
¿Qué es un archivo Parquet?
Apache Parquet es un formato columnar en disco optimizado para consultas analíticas. Los datos se particionan en row groups, cada row group en column chunks, cada chunk en páginas — para que los motores lean solo las columnas que necesitan.
¿Por qué solo 1.000 filas?
Los archivos Parquet rutinariamente llegan a cientos de millones de filas. Materializamos una muestra para que el visor siga responsivo; el recuento de filas en la barra de herramientas muestra el total real según los metadatos del footer.
¿Maneja tipos anidados?
Sí. Listas, structs y maps viajan a través de hyparquet y los renderizamos como JSON compacto. Decimales, fechas y timestamps aparecen con su anotación de tipo lógico en la pestaña Schema.
¿Se sube mi archivo?
No. Los bytes se parsean localmente en tu navegador; el archivo nunca sale de tu dispositivo.
¿Funciona en móvil?
Sí. La tabla de resultados se desplaza horizontalmente con un índice de fila fijo, y la vista de esquema se apila limpiamente en viewports estrechos.
Más sobre Datos y configuración