メインコンテンツへスキップ
メインコンテンツへスキップ

paimonCluster テーブル関数

Experimental feature. Learn more.

これは、paimon テーブル関数を拡張したものです。

指定したクラスタ内の複数のノードで、Apache Paimon のファイルを並列処理できます。イニシエーターはクラスタ内のすべてのノードへの接続を確立し、各ファイルの処理を動的に割り当てます。ワーカーノードは、処理すべき次のタスクをイニシエーターに問い合わせて処理を行います。この処理は、すべてのタスクが完了するまで繰り返されます。

構文

paimonS3Cluster(cluster_name, url [,aws_access_key_id, aws_secret_access_key] [,format] [,structure] [,compression])

paimonAzureCluster(cluster_name, connection_string|storage_account_url, container_name, blobpath, [,account_name], [,account_key] [,format] [,compression_method])

paimonHDFSCluster(cluster_name, path_to_table, [,format] [,compression_method])

引数

  • cluster_name — リモートおよびローカルサーバーへのアドレスと接続パラメータのセットを構成するために使用されるクラスタ名。
  • その他すべての引数の説明は、同等の paimon テーブル関数における引数の説明と同一です。

戻り値

指定された Paimon テーブル内のクラスタからデータを読み取るための、指定した構造を持つテーブルが返されます。

仮想カラム

  • _path — ファイルへのパス。型: LowCardinality(String)
  • _file — ファイル名。型: LowCardinality(String)
  • _size — ファイルサイズ(バイト単位)。型: Nullable(UInt64)。ファイルサイズが不明な場合、値は NULL です。
  • _time — ファイルの最終更新時刻。型: Nullable(DateTime)。時刻が不明な場合、値は NULL です。
  • _etag — ファイルの etag。型: LowCardinality(String)。etag が不明な場合、値は NULL です。

関連項目