Question 1

O que é um ficheiro Parquet?

Accepted Answer

Apache Parquet é um formato colunar em disco otimizado para queries analíticas. Os dados são particionados em row groups, cada row group em column chunks, cada chunk em páginas — para que os motores possam ler apenas as colunas necessárias.

Question 2

Porquê apenas 1.000 linhas?

Accepted Answer

Ficheiros Parquet correm rotineiramente para as centenas de milhões de linhas. Materializamos uma amostra para que o visualizador se mantenha responsivo; a contagem de linhas na barra de ferramentas mostra o total real dos metadados do footer.

Question 3

Suporta tipos aninhados?

Accepted Answer

Sim. Lists, structs e maps fazem round-trip através do hyparquet e renderizamo-los como JSON compacto. Decimais, datas e timestamps aparecem com a sua anotação de tipo lógico no separador Schema.

Question 4

O meu ficheiro é enviado para um servidor?

Accepted Answer

Não. Os bytes são analisados localmente no seu navegador; o ficheiro nunca sai do seu dispositivo.

Question 5

Funciona em telemóvel?

Accepted Answer

Sim. A tabela de resultados tem scroll horizontal com índice de linha fixo, e a vista de schema empilha-se de forma limpa em viewports estreitos.

Parquet visualizador

Abrir ficheiros Parquet

Abrir ficheiros Parquet