Question 1

什么是 Parquet 文件?

Accepted Answer

Apache Parquet 是为分析查询优化的列式磁盘格式。数据按行组分区,每个行组按列块,每个列块按页——这样引擎就能仅读取所需的列。

Question 2

为什么只有 1000 行?

Accepted Answer

Parquet 文件动辄数亿行。我们物化一个样本以保持查看器响应;工具栏中的行数显示来自页脚元数据的真实总数。

Question 3

支持嵌套类型吗?

Accepted Answer

支持。列表、结构体和映射通过 hyparquet 往返,我们将它们渲染为紧凑 JSON。十进制、日期和时间戳在 Schema 标签中以其逻辑类型注解呈现。

Question 4

我的文件会被上传吗?

Accepted Answer

不会。字节在浏览器中本地解析;文件从不离开你的设备。

Question 5

在移动端能用吗?

Accepted Answer

可以。结果表横向滚动并固定行索引,在窄视口下 schema 视图也能干净地堆叠。

Parquet 查看器

打开 Parquet 文件