paimonCluster 表函数
Experimental feature. Learn more.
这是对 paimon 表函数的扩展。
允许在指定集群中的多个节点上并行处理来自 Apache Paimon 的文件。在发起节点上,它会与集群中所有节点建立连接,并动态分派每个文件。在工作节点上,它会向发起节点请求下一个要处理的任务并对其进行处理。此过程会重复,直到所有任务全部完成。
语法
参数
cluster_name— 用于构建远程和本地服务器地址及连接参数集合的集群名称。- 其他所有参数的说明与等价的 paimon 表函数中的参数说明相同。
返回值
一个具有指定结构的表,用于从集群中读取指定 Paimon 表的数据。
虚拟列
_path— 文件路径。类型:LowCardinality(String)。_file— 文件名。类型:LowCardinality(String)。_size— 文件大小(以字节为单位)。类型:Nullable(UInt64)。如果文件大小未知,则值为NULL。_time— 文件最近一次修改时间。类型:Nullable(DateTime)。如果时间未知,则值为NULL。_etag— 文件的 ETag。类型:LowCardinality(String)。如果 ETag 未知,则值为NULL。
另请参阅