Данные и конфигурация.parquet
Parquet просмотрщик
О формате Parquet
Колоночный data-формат Apache.
Parquet — современный колоночный аналитический формат: backing-хранилище для Spark, Athena, DuckDB, внешних таблиц BigQuery и hub'а Hugging Face datasets. hyparquet декодирует его прямо в браузере без WebAssembly, читая сначала footer-метаданные, а затем материализуя только запрошенные строки. Мы сэмплируем первые 1000 строк, так что многогигабайтный файл открывается мгновенно, показываем схему leaf-колонок с логическими типами и repetition modes и позволяем экспортировать сэмпл как JSON. Вложенные значения (списки, структуры, map) отрисовываются как компактный JSON; бинарные колонки представлены длиной в байтах.
Частые вопросы
- Что такое Parquet-файл?
- Apache Parquet — колоночный on-disk формат, оптимизированный для аналитических запросов. Данные разбиты на row groups, каждая row group — на column chunks, каждый chunk — на pages, так что движки могут читать только нужные им колонки.
- Почему только 1000 строк?
- Файлы Parquet регулярно содержат сотни миллионов строк. Мы материализуем сэмпл, чтобы вьюер оставался отзывчивым; счёт строк на тулбаре показывает истинную сумму из footer-метаданных.
- Обрабатывает ли вложенные типы?
- Да. Списки, структуры и map проходят через hyparquet, и мы рендерим их как компактный JSON. Decimals, дата и timestamp показываются с аннотацией логического типа во вкладке Schema.
- Загружается ли мой файл?
- Нет. Байты парсятся локально в вашем браузере; файл никогда не покидает устройство.
- Работает ли на мобильных?
- Да. Таблица результатов прокручивается горизонтально с прилипшим индексом строк, а схема компактно укладывается на узких экранах.
Ещё в разделе «Данные и конфигурация»
- .jsonJSONJavaScript Object Notation — структурированные данные.Открыть
- .csvCSVТабличные данные CSV.Открыть
- .tsvTSVTab-Separated Values табличные данные.Открыть
- .xmlXMLExtensible Markup Language.Открыть
- .yamlYAMLЧеловекочитаемый формат конфигов/данных.Открыть
- .tomlTOMLTom's Obvious Minimal Language config.Открыть
- .iniINIКлассические config-файлы key=value.Открыть
- .dbSQLiteФайл базы данных .db / .sqlite.Открыть