Dados e Configuração.parquet
Parquet visualizador
Sobre Parquet
Formato de dados colunar Apache.
Parquet é o formato moderno colunar de análise — o armazenamento por trás do Spark, Athena, DuckDB, tabelas externas do BigQuery e do hub de datasets do Hugging Face. hyparquet descodifica-o diretamente no navegador sem WebAssembly, lendo primeiro os metadados do footer e materializando apenas as linhas que pedir. Amostramos as primeiras 1.000 linhas para que um ficheiro de vários gigabytes abra instantaneamente, expomos o schema das colunas folha com tipos lógicos e modos de repetição e permitimos exportar a amostra como JSON. Valores aninhados (lists, structs, maps) são renderizados como JSON compacto; colunas binárias são resumidas pelo comprimento em bytes.
Perguntas frequentes
- O que é um ficheiro Parquet?
- Apache Parquet é um formato colunar em disco otimizado para queries analíticas. Os dados são particionados em row groups, cada row group em column chunks, cada chunk em páginas — para que os motores possam ler apenas as colunas necessárias.
- Porquê apenas 1.000 linhas?
- Ficheiros Parquet correm rotineiramente para as centenas de milhões de linhas. Materializamos uma amostra para que o visualizador se mantenha responsivo; a contagem de linhas na barra de ferramentas mostra o total real dos metadados do footer.
- Suporta tipos aninhados?
- Sim. Lists, structs e maps fazem round-trip através do hyparquet e renderizamo-los como JSON compacto. Decimais, datas e timestamps aparecem com a sua anotação de tipo lógico no separador Schema.
- O meu ficheiro é enviado para um servidor?
- Não. Os bytes são analisados localmente no seu navegador; o ficheiro nunca sai do seu dispositivo.
- Funciona em telemóvel?
- Sim. A tabela de resultados tem scroll horizontal com índice de linha fixo, e a vista de schema empilha-se de forma limpa em viewports estreitos.
Mais Dados e Configuração
- .jsonJSONJavaScript Object Notation — dados estruturados.Abrir
- .csvCSVComma-Separated Values — dados tabulares.Abrir
- .tsvTSVDados tabulares Tab-Separated Values.Abrir
- .xmlXMLExtensible Markup Language.Abrir
- .yamlYAMLFormato de configuração/dados legível por humanos.Abrir
- .tomlTOMLConfiguração Tom's Obvious Minimal Language.Abrir
- .iniINIArquivos de config clássicos key=value.Abrir
- .dbSQLiteFicheiro de base de dados .db / .sqlite.Abrir