uDocumentViewer
Данные и конфигурация.parquet

Parquet просмотрщик

готово
О формате Parquet

Колоночный data-формат Apache.

Parquet — современный колоночный аналитический формат: backing-хранилище для Spark, Athena, DuckDB, внешних таблиц BigQuery и hub'а Hugging Face datasets. hyparquet декодирует его прямо в браузере без WebAssembly, читая сначала footer-метаданные, а затем материализуя только запрошенные строки. Мы сэмплируем первые 1000 строк, так что многогигабайтный файл открывается мгновенно, показываем схему leaf-колонок с логическими типами и repetition modes и позволяем экспортировать сэмпл как JSON. Вложенные значения (списки, структуры, map) отрисовываются как компактный JSON; бинарные колонки представлены длиной в байтах.

Частые вопросы
Что такое Parquet-файл?
Apache Parquet — колоночный on-disk формат, оптимизированный для аналитических запросов. Данные разбиты на row groups, каждая row group — на column chunks, каждый chunk — на pages, так что движки могут читать только нужные им колонки.
Почему только 1000 строк?
Файлы Parquet регулярно содержат сотни миллионов строк. Мы материализуем сэмпл, чтобы вьюер оставался отзывчивым; счёт строк на тулбаре показывает истинную сумму из footer-метаданных.
Обрабатывает ли вложенные типы?
Да. Списки, структуры и map проходят через hyparquet, и мы рендерим их как компактный JSON. Decimals, дата и timestamp показываются с аннотацией логического типа во вкладке Schema.
Загружается ли мой файл?
Нет. Байты парсятся локально в вашем браузере; файл никогда не покидает устройство.
Работает ли на мобильных?
Да. Таблица результатов прокручивается горизонтально с прилипшим индексом строк, а схема компактно укладывается на узких экранах.
Ещё в разделе «Данные и конфигурация»