uDocumentViewer
データと設定.parquet

Parquet ビューア

利用可能
Parquetについて

Apache カラムナデータ形式。

Parquet はモダンなカラムナ分析形式で、Spark、Athena、DuckDB、BigQuery 外部テーブル、Hugging Face datasets ハブのバッキングストレージです。hyparquet が WebAssembly なしでブラウザ内で直接デコードし、まずフッターメタデータを読み込み、要求された行だけをマテリアライズします。最初の 1,000 行をサンプリングするので、数ギガバイトのファイルが瞬時に開きます。論理型と繰り返しモードを持つリーフカラムスキーマを表示し、サンプルを JSON としてエクスポートできます。ネスト値 (list、struct、map) はコンパクトな JSON としてレンダリングされ、バイナリカラムはバイト長で要約されます。

よくある質問
Parquet ファイルとは何ですか?
Apache Parquet は分析クエリ向けに最適化されたカラムナオンディスク形式です。データは行グループに分割され、各行グループはカラムチャンクに、各チャンクはページに分割されるので、エンジンは必要なカラムだけを読むことができます。
なぜ 1,000 行だけなのですか?
Parquet ファイルは普通に数億行に達します。ビューアの応答性を保つためにサンプルをマテリアライズします。ツールバーの行数は、フッターメタデータからの本来の総数を示します。
ネスト型を扱えますか?
はい。list、struct、map は hyparquet をラウンドトリップし、コンパクトな JSON としてレンダリングします。decimal、date、timestamp はスキーマタブで論理型アノテーションと共に表示されます。
ファイルはアップロードされますか?
いいえ。バイトはブラウザ内でローカルにパースされます。ファイルはデバイスから出ません。
モバイルでも動作しますか?
はい。結果テーブルはスティッキーな行インデックス付きで水平スクロールし、スキーマビューは狭いビューポートでも整然と並びます。
他のデータと設定