uDocumentViewer
Данные и конфигурация.arrow · .feather · .ipc

Arrow / Feather просмотрщик

готово
О формате Arrow / Feather

Колоночный формат Apache Arrow.

Apache Arrow — это колоночный стандарт хранения в памяти, который Pandas, Polars, DuckDB, BigQuery Storage и большинство современных DataFrame-библиотек используют нативно. Feather — это дисковая форма Arrow, записанная через Arrow IPC framing. Этот вьюер читает любой из них — .arrow, .feather или сырой .ipc — используя tableFromIPC из apache-arrow. Мы показываем схему (имена колонок, логические типы, nullability) и материализуем первые 2000 строк для табличного просмотра. Вложенные типы (list, struct, map) и timestamp проходят без потерь; бинарные колонки представлены длиной в байтах.

Частые вопросы
В чём разница между Arrow и Feather?
Arrow описывает колоночную раскладку в памяти; Feather — это формат файла, который хранит буферы Arrow на диске, используя Arrow IPC framing. Современный Feather (v2) — это просто IPC-файл Arrow с расширением .feather.
Загружается ли мой файл?
Нет. Файл декодируется полностью в вашем браузере с помощью JavaScript-библиотеки apache-arrow. Ничего не покидает ваше устройство.
Поддерживаются ли вложенные типы?
Да. Списки, структуры, map, dictionary-encoded колонки и timestamp декодируются в читаемые значения. Вложенные строки показаны как компактный JSON.
Почему количество строк больше того, что я вижу?
Мы материализуем первые 2000 строк, чтобы страница оставалась отзывчивой; на тулбаре показано истинное количество строк из метаданных схемы.
Работает ли это на мобильных устройствах?
Да. Таблица прокручивается горизонтально с прилипшим индексом строк, а схема компактно укладывается на узких экранах.
Ещё в разделе «Данные и конфигурация»