Question 1

Parquet ファイルとは何ですか?

Accepted Answer

Apache Parquet は分析クエリ向けに最適化されたカラムナオンディスク形式です。データは行グループに分割され、各行グループはカラムチャンクに、各チャンクはページに分割されるので、エンジンは必要なカラムだけを読むことができます。

Question 2

なぜ 1,000 行だけなのですか?

Accepted Answer

Parquet ファイルは普通に数億行に達します。ビューアの応答性を保つためにサンプルをマテリアライズします。ツールバーの行数は、フッターメタデータからの本来の総数を示します。

Question 3

ネスト型を扱えますか?

Accepted Answer

はい。list、struct、map は hyparquet をラウンドトリップし、コンパクトな JSON としてレンダリングします。decimal、date、timestamp はスキーマタブで論理型アノテーションと共に表示されます。

Question 4

ファイルはアップロードされますか?

Accepted Answer

いいえ。バイトはブラウザ内でローカルにパースされます。ファイルはデバイスから出ません。

Question 5

モバイルでも動作しますか?

Accepted Answer

はい。結果テーブルはスティッキーな行インデックス付きで水平スクロールし、スキーマビューは狭いビューポートでも整然と並びます。

Parquet ビューア

Parquetファイルを開く