CapnProto
| 输入 | 输出 | 别名 |
|---|---|---|
| ✔ | ✔ |
描述
CapnProto 格式是一种二进制消息格式,类似 Protocol Buffers 格式和 Thrift,但不同于 JSON 或 MessagePack。
CapnProto 消息是严格类型且非自描述的,这意味着它们需要外部的 schema 定义。Schema 会在运行时应用,并针对每个查询进行缓存。
另请参阅 Format Schema。
数据类型匹配
下表显示了支持的数据类型,以及它们在 INSERT 和 SELECT 查询中对应的 ClickHouse 数据类型。
CapnProto 数据类型(INSERT) | ClickHouse 数据类型 | CapnProto 数据类型(SELECT) |
|---|---|---|
UINT8, BOOL | UInt8 | UINT8 |
INT8 | Int8 | INT8 |
UINT16 | UInt16, Date | UINT16 |
INT16 | Int16 | INT16 |
UINT32 | UInt32, DateTime | UINT32 |
INT32 | Int32, Decimal32 | INT32 |
UINT64 | UInt64 | UINT64 |
INT64 | Int64, DateTime64, Decimal64 | INT64 |
FLOAT32 | Float32 | FLOAT32 |
FLOAT64 | Float64 | FLOAT64 |
TEXT, DATA | String, FixedString | TEXT, DATA |
union(T, Void), union(Void, T) | Nullable(T) | union(T, Void), union(Void, T) |
ENUM | Enum(8/16) | ENUM |
LIST | Array | LIST |
STRUCT | Tuple | STRUCT |
UINT32 | IPv4 | UINT32 |
DATA | IPv6 | DATA |
DATA | Int128/UInt128/Int256/UInt256 | DATA |
DATA | Decimal128/Decimal256 | DATA |
STRUCT(entries LIST(STRUCT(key Key, value Value))) | Map | STRUCT(entries LIST(STRUCT(key Key, value Value))) |
- 整数类型在输入和输出时可以相互转换。
- 要在 CapnProto 格式中使用
Enum,请使用 format_capn_proto_enum_comparising_mode 设置。 - 数组可以嵌套,并且其元素可以是
Nullable类型。Tuple和Map类型也可以嵌套。
示例用法
插入和查询数据
可以通过以下命令,将文件中的 CapnProto 数据插入到 ClickHouse 表中:
其中 schema.capnp 文件内容如下:
您可以通过以下命令,从 ClickHouse 表中查询数据,并将其以 CapnProto 格式保存到某个文件中:
使用自动生成的 schema
如果你的数据没有外部定义的 CapnProto schema,你仍然可以使用自动生成的 schema 以 CapnProto 格式输入/输出数据。
例如:
在这种情况下,ClickHouse 会根据表结构使用函数 structureToCapnProtoSchema 自动生成 CapnProto schema,并使用该 schema 以 CapnProto 格式序列化数据。
你也可以读取使用自动生成 schema 的 CapnProto 文件(在这种情况下,文件必须使用相同的 schema 创建):
格式设置
设置 format_capn_proto_use_autogenerated_schema 默认启用,仅在未设置 format_schema 时生效。
你也可以在输入/输出时通过设置 output_format_schema 将自动生成的 schema 保存到文件中。
例如:
在这种情况下,自动生成的 CapnProto 模式将会保存在文件 path/to/schema/schema.capnp 中。