Question 1

Что такое Parquet-файл?

Accepted Answer

Apache Parquet — колоночный on-disk формат, оптимизированный для аналитических запросов. Данные разбиты на row groups, каждая row group — на column chunks, каждый chunk — на pages, так что движки могут читать только нужные им колонки.

Question 2

Почему только 1000 строк?

Accepted Answer

Файлы Parquet регулярно содержат сотни миллионов строк. Мы материализуем сэмпл, чтобы вьюер оставался отзывчивым; счёт строк на тулбаре показывает истинную сумму из footer-метаданных.

Question 3

Обрабатывает ли вложенные типы?

Accepted Answer

Да. Списки, структуры и map проходят через hyparquet, и мы рендерим их как компактный JSON. Decimals, дата и timestamp показываются с аннотацией логического типа во вкладке Schema.

Question 4

Загружается ли мой файл?

Accepted Answer

Нет. Байты парсятся локально в вашем браузере; файл никогда не покидает устройство.

Question 5

Работает ли на мобильных?

Accepted Answer

Да. Таблица результатов прокручивается горизонтально с прилипшим индексом строк, а схема компактно укладывается на узких экранах.

Parquet просмотрщик

Открыть файлы Parquet

Открыть файлы Parquet