跳到主要内容
跳到主要内容

Hudi 表函数

提供只读的类表接口,用于访问存储在 Amazon S3 中的 Apache Hudi 表。

语法

hudi(url [,aws_access_key_id, aws_secret_access_key] [,format] [,structure] [,compression])

参数

参数说明
url指向 S3 中现有 Hudi 表的 bucket URL 和路径。
aws_access_key_id, aws_secret_access_keyAWS 账户用户的长期凭证。您可以使用这些凭证对请求进行身份验证。这些参数为可选项。如果未指定凭证,将使用 ClickHouse 配置中的凭证。更多信息请参见 Using S3 for Data Storage
format文件的格式
structure表结构。格式为 'column1_name column1_type, column2_name column2_type, ...'
compression可选参数。支持的取值:nonegzip/gzbrotli/brxz/LZMAzstd/zst。默认情况下,将根据文件扩展名自动检测压缩格式。

返回值

一个具有指定结构的表,用于从 S3 中指定的 Hudi 表读取数据。

虚拟列

  • _path — 文件路径。类型:LowCardinality(String)
  • _file — 文件名。类型:LowCardinality(String)
  • _size — 文件大小(字节数)。类型:Nullable(UInt64)。如果文件大小未知,则该值为 NULL
  • _time — 文件的最后修改时间。类型:Nullable(DateTime)。如果时间未知,则该值为 NULL
  • _etag — 文件的 etag 值。类型:LowCardinality(String)。如果 etag 未知,则该值为 NULL