データと設定.parquet
Parquet ビューア
Parquetについて
Apache カラムナデータ形式。
Parquet はモダンなカラムナ分析形式で、Spark、Athena、DuckDB、BigQuery 外部テーブル、Hugging Face datasets ハブのバッキングストレージです。hyparquet が WebAssembly なしでブラウザ内で直接デコードし、まずフッターメタデータを読み込み、要求された行だけをマテリアライズします。最初の 1,000 行をサンプリングするので、数ギガバイトのファイルが瞬時に開きます。論理型と繰り返しモードを持つリーフカラムスキーマを表示し、サンプルを JSON としてエクスポートできます。ネスト値 (list、struct、map) はコンパクトな JSON としてレンダリングされ、バイナリカラムはバイト長で要約されます。
よくある質問
- Parquet ファイルとは何ですか?
- Apache Parquet は分析クエリ向けに最適化されたカラムナオンディスク形式です。データは行グループに分割され、各行グループはカラムチャンクに、各チャンクはページに分割されるので、エンジンは必要なカラムだけを読むことができます。
- なぜ 1,000 行だけなのですか?
- Parquet ファイルは普通に数億行に達します。ビューアの応答性を保つためにサンプルをマテリアライズします。ツールバーの行数は、フッターメタデータからの本来の総数を示します。
- ネスト型を扱えますか?
- はい。list、struct、map は hyparquet をラウンドトリップし、コンパクトな JSON としてレンダリングします。decimal、date、timestamp はスキーマタブで論理型アノテーションと共に表示されます。
- ファイルはアップロードされますか?
- いいえ。バイトはブラウザ内でローカルにパースされます。ファイルはデバイスから出ません。
- モバイルでも動作しますか?
- はい。結果テーブルはスティッキーな行インデックス付きで水平スクロールし、スキーマビューは狭いビューポートでも整然と並びます。
他のデータと設定
- .jsonJSONJavaScript Object Notation — 構造化データ。開く
- .csvCSVComma-Separated Values 表形式データ。開く
- .tsvTSVTab-Separated Values 表形式データ。開く
- .xmlXMLExtensible Markup Language。開く
- .yamlYAML人間可読な設定/データ形式。開く
- .tomlTOMLTom's Obvious Minimal Language 設定。開く
- .iniINIクラシックな key=value 設定ファイル。開く
- .dbSQLite.db / .sqlite データベースファイル。開く