system.parts
描述
包含关于 MergeTree 表 parts 的信息。
每一行描述一个 parts。
列
partition(String) — 分区标识符 (由表分区键表达式派生出的字符串表示) 。name(String) — 数据分片名称。分片命名结构可用于判断数据、摄取以及合并模式等多个方面。分片命名格式如下:
-
定义:
partition_id- 标识分区 IDminimum_block_number- 标识该 part 中的最小块号。ClickHouse 始终合并连续的块maximum_block_number- 标识该 part 中的最大块号level- 每对该 part 进行一次合并,该值加一。level 为 0 表示这是一个尚未被合并的新 part。需要牢记的是,ClickHouse 中的所有 part 始终都是不可变的data_version- 可选值,在对 part 执行 mutate 操作时递增 (同样,变更后的数据始终只会写入新的 part,因为 part 是不可变的)
-
uuid(UUID) — 数据分区片段的 UUID。 -
part_type(String) — 数据分区片段的存储格式。可选值:Wide— 每一列存储在单独的文件中,Compact— 所有列都存储在同一个文件中。数据存储格式由 MergeTree 表的min_bytes_for_wide_part和min_rows_for_wide_part设置控制。 -
active(UInt8) — 表示数据分区片段是否为活动状态的标志。活动的数据分区片段会被表使用;否则即将被删除。非活动数据分区片段会在合并和变更操作后出现。 -
marks(UInt64) — marks 的数量。要获取数据分区片段中的近似行数,可将 marks 乘以索引粒度 (通常为 8192) (此提示不适用于自适应粒度) 。 -
rows(UInt64) — 行数。 -
files(UInt64) — 数据分区片段中的文件数量。 -
bytes_on_disk(UInt64) — 所有数据分区片段文件的总大小 (以字节为单位) 。 -
data_compressed_bytes(UInt64) — 数据分区片段中压缩数据的总大小。不包括所有辅助文件 (例如标记文件) 。 -
data_uncompressed_bytes(UInt64) — 数据分区片段中未压缩数据的总大小。不包括任何辅助文件 (例如标记文件) 。 -
primary_key_size(UInt64) — 磁盘上 primary.idx/cidx 文件中主键值占用的内存量 (以字节为单位) 。 -
marks_bytes(UInt64) — 标记文件的大小。 -
secondary_indices_compressed_bytes(UInt64) — 数据分区片段中二级索引的压缩数据总大小。不包括任何辅助文件 (例如,包含 marks 的文件) 。 -
secondary_indices_uncompressed_bytes(UInt64) — 数据分区片段中二级索引未压缩数据的总大小。不包括所有辅助文件 (例如 marks 文件) 。 -
secondary_indices_marks_bytes(UInt64) — 存储二级索引标记的文件大小。 -
modification_time(DateTime) — 存放该数据分区片段的目录的修改时间。通常对应于该数据分区片段的创建时间。 -
remove_time(DateTime) — 数据分区片段变为非活动状态的时间。 -
refcount(UInt32) — 数据分区片段被引用的位置数。值大于 2 表示该数据分区片段用于查询或合并操作。 -
min_date(Date) — 数据分区片段中日期键的最小值。 -
max_date(Date) — 数据分区片段中日期键的最大值。 -
min_time(DateTime) — 数据分区片段中的日期和时间键的最小值。 -
max_time(DateTime) — 数据分区片段中的日期时间键的最大值。 -
partition_id(String) — 分区 ID。 -
min_block_number(Int64) — 合并后组成当前 part 的数据分区片段中的最小编号。 -
max_block_number(Int64) — 合并后构成当前 part 的数据分区片段的最大数量。 -
level(UInt32) — MergeTree 的深度。0 表示当前 part 是通过 insert 创建的,而不是由其他 parts 合并而成。 -
data_version(UInt64) — 用于确定应对数据分区片段应用哪些 mutation 的编号 (版本高于 data_version 的 mutation) 。 -
primary_key_bytes_in_memory(UInt64) — 主键值占用的内存量 (以字节为单位) 。启用primary_key_lazy_load且主键尚未加载时,该值为 0。 -
primary_key_bytes_in_memory_allocated(UInt64) — 为主键值预留的内存大小 (以字节为单位) 。启用primary_key_lazy_load且主键未加载时,该值为 0。 -
index_granularity_bytes_in_memory(UInt64) — 索引粒度值使用的内存量 (以字节为单位) (在 primary_key_lazy_load=1 且 use_primary_key_cache=1 时,该值为 0) 。 -
index_granularity_bytes_in_memory_allocated(UInt64) — 为索引粒度值预留的内存大小 (以字节为单位) (当 primary_key_lazy_load=1 且 use_primary_key_cache=1 时,该值为 0) 。 -
is_frozen(UInt8) — 表示是否存在分区数据备份的标志。1 表示备份存在。0 表示备份不存在。更多详情,请参阅 FREEZE PARTITION。 -
database(String) — 数据库的名称。 -
table(String) — 表名。 -
engine(String) — 表引擎名称,不包含参数。 -
disk_name(String) — 存储该数据分区片段的磁盘名称。 -
path(String) — 数据分区片段文件所在文件夹的绝对路径。 -
hash_of_all_files(String) — 所有压缩文件的 sipHash128 哈希值。 -
hash_of_uncompressed_files(String) — 未压缩文件 (如包含 marks、索引文件等的文件) 的 sipHash128。 -
uncompressed_hash_of_compressed_files(String) — 将压缩文件中的数据按未压缩状态处理时计算得到的 sipHash128 值。 -
delete_ttl_info_min(DateTime) — TTL DELETE 规则中日期和时间键的最小值。 -
delete_ttl_info_max(DateTime) — TTL DELETE 规则对应的日期时间键的最大值。 -
move_ttl_info.expression(Array(String)) — 由表达式组成的数组。每个表达式定义一条 TTL MOVE 规则。 -
move_ttl_info.min(Array(DateTime)) — 日期和时间值数组。每个元素表示 TTL MOVE 规则的最小键值。 -
move_ttl_info.max(Array(DateTime)) — 日期和时间值组成的数组。每个元素表示某条生存时间 (TTL) MOVE 规则的最大键值。 -
default_compression_codec(String) — 用于压缩此数据分区片段的编解码器名称 (如果列未显式指定编解码器) 。 -
recompression_ttl_info.expression(Array(String)) — 生存时间 (TTL) 表达式。 -
recompression_ttl_info.min(Array(DateTime)) — 该数据分片中计算所得 TTL 表达式的最小值。用于判断是否至少存在一行的 TTL 已过期。 -
recompression_ttl_info.max(Array(DateTime)) — 此 part 中计算得到的生存时间 (TTL) 表达式的最大值。用于判断是否所有行的 TTL 均已过期。 -
group_by_ttl_info.expression(Array(String)) — TTL 表达式。 -
group_by_ttl_info.min(Array(DateTime)) — 此数据片段中计算出的生存时间 (TTL) 表达式的最小值。用于判断是否至少存在一行的 TTL 已过期。 -
group_by_ttl_info.max(Array(DateTime)) — 此 part 内计算出的 TTL 表达式的最大值。用于判断是否所有行的 TTL 均已过期。 -
rows_where_ttl_info.expression(Array(String)) — 生存时间 (TTL) 表达式。 -
rows_where_ttl_info.min(Array(DateTime)) — 该 part 中计算得到的生存时间 (TTL) 表达式的最小值。用于判断是否至少有一行的生存时间 (TTL) 已过期。 -
rows_where_ttl_info.max(Array(DateTime)) — 该 part 内计算得到的 TTL 表达式的最大值。用于判断是否所有行的生存时间 (TTL) 都已过期。 -
projections(Array(String)) — 为该 part 计算得到的投影名称列表。 -
visible(UInt8) — 指示该数据 part 是否对 SELECT 查询可见的标志。 -
creation_tid(Tuple(UInt64, UInt64, UUID)) — 已创建或正尝试创建此对象的事务 ID。 -
removal_tid_lock(UInt64) —removal_tid的哈希值,用于在移除对象时对其加锁。 -
removal_tid(Tuple(UInt64, UInt64, UUID)) — 已移除/正尝试移除此对象的事务 ID -
creation_csn(UInt64) — 创建此对象的事务 CSN -
removal_csn(UInt64) — 移除此对象的事务 CSN -
has_lightweight_delete(UInt8) — 指示该 part 是否带有轻量级删除掩码的标志。 -
last_removal_attempt_time(DateTime) — 服务器上次尝试删除此 part 的时间。 -
removal_state(String) — part 删除过程的当前状态。
别名:
bytes—bytes_on_disk的别名。marks_size—marks_bytes的别名。part_name—name的别名。