uDocumentViewer
Dados e Configuração.parquet

Parquet visualizador

pronto
Sobre Parquet

Formato de dados colunar Apache.

Parquet é o formato moderno colunar de análise — o armazenamento por trás do Spark, Athena, DuckDB, tabelas externas do BigQuery e do hub de datasets do Hugging Face. hyparquet descodifica-o diretamente no navegador sem WebAssembly, lendo primeiro os metadados do footer e materializando apenas as linhas que pedir. Amostramos as primeiras 1.000 linhas para que um ficheiro de vários gigabytes abra instantaneamente, expomos o schema das colunas folha com tipos lógicos e modos de repetição e permitimos exportar a amostra como JSON. Valores aninhados (lists, structs, maps) são renderizados como JSON compacto; colunas binárias são resumidas pelo comprimento em bytes.

Perguntas frequentes
O que é um ficheiro Parquet?
Apache Parquet é um formato colunar em disco otimizado para queries analíticas. Os dados são particionados em row groups, cada row group em column chunks, cada chunk em páginas — para que os motores possam ler apenas as colunas necessárias.
Porquê apenas 1.000 linhas?
Ficheiros Parquet correm rotineiramente para as centenas de milhões de linhas. Materializamos uma amostra para que o visualizador se mantenha responsivo; a contagem de linhas na barra de ferramentas mostra o total real dos metadados do footer.
Suporta tipos aninhados?
Sim. Lists, structs e maps fazem round-trip através do hyparquet e renderizamo-los como JSON compacto. Decimais, datas e timestamps aparecem com a sua anotação de tipo lógico no separador Schema.
O meu ficheiro é enviado para um servidor?
Não. Os bytes são analisados localmente no seu navegador; o ficheiro nunca sai do seu dispositivo.
Funciona em telemóvel?
Sim. A tabela de resultados tem scroll horizontal com índice de linha fixo, e a vista de schema empilha-se de forma limpa em viewports estreitos.
Mais Dados e Configuração