跳转到主内容
跳转到主内容

system.parts

描述

包含关于 MergeTree 表 parts 的信息。

每一行描述一个 parts。

  • partition (String) — 分区标识符 (由表分区键表达式派生出的字符串表示) 。
  • name (String) — 数据分片名称。分片命名结构可用于判断数据、摄取以及合并模式等多个方面。分片命名格式如下:
<partition_id>_<minimum_block_number>_<maximum_block_number>_<level>_<data_version>
  • 定义:

    • partition_id - 标识分区 ID
    • minimum_block_number - 标识该 part 中的最小块号。ClickHouse 始终合并连续的块
    • maximum_block_number - 标识该 part 中的最大块号
    • level - 每对该 part 进行一次合并,该值加一。level 为 0 表示这是一个尚未被合并的新 part。需要牢记的是,ClickHouse 中的所有 part 始终都是不可变的
    • data_version - 可选值,在对 part 执行 mutate 操作时递增 (同样,变更后的数据始终只会写入新的 part,因为 part 是不可变的)
  • uuid (UUID) — 数据分区片段的 UUID。

  • part_type (String) — 数据分区片段的存储格式。可选值:Wide — 每一列存储在单独的文件中,Compact — 所有列都存储在同一个文件中。数据存储格式由 MergeTree 表的 min_bytes_for_wide_partmin_rows_for_wide_part 设置控制。

  • active (UInt8) — 表示数据分区片段是否为活动状态的标志。活动的数据分区片段会被表使用;否则即将被删除。非活动数据分区片段会在合并和变更操作后出现。

  • marks (UInt64) — marks 的数量。要获取数据分区片段中的近似行数,可将 marks 乘以索引粒度 (通常为 8192) (此提示不适用于自适应粒度) 。

  • rows (UInt64) — 行数。

  • files (UInt64) — 数据分区片段中的文件数量。

  • bytes_on_disk (UInt64) — 所有数据分区片段文件的总大小 (以字节为单位) 。

  • data_compressed_bytes (UInt64) — 数据分区片段中压缩数据的总大小。不包括所有辅助文件 (例如标记文件) 。

  • data_uncompressed_bytes (UInt64) — 数据分区片段中未压缩数据的总大小。不包括任何辅助文件 (例如标记文件) 。

  • primary_key_size (UInt64) — 磁盘上 primary.idx/cidx 文件中主键值占用的内存量 (以字节为单位) 。

  • marks_bytes (UInt64) — 标记文件的大小。

  • secondary_indices_compressed_bytes (UInt64) — 数据分区片段中二级索引的压缩数据总大小。不包括任何辅助文件 (例如,包含 marks 的文件) 。

  • secondary_indices_uncompressed_bytes (UInt64) — 数据分区片段中二级索引未压缩数据的总大小。不包括所有辅助文件 (例如 marks 文件) 。

  • secondary_indices_marks_bytes (UInt64) — 存储二级索引标记的文件大小。

  • modification_time (DateTime) — 存放该数据分区片段的目录的修改时间。通常对应于该数据分区片段的创建时间。

  • remove_time (DateTime) — 数据分区片段变为非活动状态的时间。

  • refcount (UInt32) — 数据分区片段被引用的位置数。值大于 2 表示该数据分区片段用于查询或合并操作。

  • min_date (Date) — 数据分区片段中日期键的最小值。

  • max_date (Date) — 数据分区片段中日期键的最大值。

  • min_time (DateTime) — 数据分区片段中的日期和时间键的最小值。

  • max_time (DateTime) — 数据分区片段中的日期时间键的最大值。

  • partition_id (String) — 分区 ID。

  • min_block_number (Int64) — 合并后组成当前 part 的数据分区片段中的最小编号。

  • max_block_number (Int64) — 合并后构成当前 part 的数据分区片段的最大数量。

  • level (UInt32) — MergeTree 的深度。0 表示当前 part 是通过 insert 创建的,而不是由其他 parts 合并而成。

  • data_version (UInt64) — 用于确定应对数据分区片段应用哪些 mutation 的编号 (版本高于 data_version 的 mutation) 。

  • primary_key_bytes_in_memory (UInt64) — 主键值占用的内存量 (以字节为单位) 。启用 primary_key_lazy_load 且主键尚未加载时,该值为 0。

  • primary_key_bytes_in_memory_allocated (UInt64) — 为主键值预留的内存大小 (以字节为单位) 。启用 primary_key_lazy_load 且主键未加载时,该值为 0。

  • index_granularity_bytes_in_memory (UInt64) — 索引粒度值使用的内存量 (以字节为单位) (在 primary_key_lazy_load=1 且 use_primary_key_cache=1 时,该值为 0) 。

  • index_granularity_bytes_in_memory_allocated (UInt64) — 为索引粒度值预留的内存大小 (以字节为单位) (当 primary_key_lazy_load=1 且 use_primary_key_cache=1 时,该值为 0) 。

  • is_frozen (UInt8) — 表示是否存在分区数据备份的标志。1 表示备份存在。0 表示备份不存在。更多详情,请参阅 FREEZE PARTITION。

  • database (String) — 数据库的名称。

  • table (String) — 表名。

  • engine (String) — 表引擎名称,不包含参数。

  • disk_name (String) — 存储该数据分区片段的磁盘名称。

  • path (String) — 数据分区片段文件所在文件夹的绝对路径。

  • hash_of_all_files (String) — 所有压缩文件的 sipHash128 哈希值。

  • hash_of_uncompressed_files (String) — 未压缩文件 (如包含 marks、索引文件等的文件) 的 sipHash128。

  • uncompressed_hash_of_compressed_files (String) — 将压缩文件中的数据按未压缩状态处理时计算得到的 sipHash128 值。

  • delete_ttl_info_min (DateTime) — TTL DELETE 规则中日期和时间键的最小值。

  • delete_ttl_info_max (DateTime) — TTL DELETE 规则对应的日期时间键的最大值。

  • move_ttl_info.expression (Array(String)) — 由表达式组成的数组。每个表达式定义一条 TTL MOVE 规则。

  • move_ttl_info.min (Array(DateTime)) — 日期和时间值数组。每个元素表示 TTL MOVE 规则的最小键值。

  • move_ttl_info.max (Array(DateTime)) — 日期和时间值组成的数组。每个元素表示某条生存时间 (TTL) MOVE 规则的最大键值。

  • default_compression_codec (String) — 用于压缩此数据分区片段的编解码器名称 (如果列未显式指定编解码器) 。

  • recompression_ttl_info.expression (Array(String)) — 生存时间 (TTL) 表达式。

  • recompression_ttl_info.min (Array(DateTime)) — 该数据分片中计算所得 TTL 表达式的最小值。用于判断是否至少存在一行的 TTL 已过期。

  • recompression_ttl_info.max (Array(DateTime)) — 此 part 中计算得到的生存时间 (TTL) 表达式的最大值。用于判断是否所有行的 TTL 均已过期。

  • group_by_ttl_info.expression (Array(String)) — TTL 表达式。

  • group_by_ttl_info.min (Array(DateTime)) — 此数据片段中计算出的生存时间 (TTL) 表达式的最小值。用于判断是否至少存在一行的 TTL 已过期。

  • group_by_ttl_info.max (Array(DateTime)) — 此 part 内计算出的 TTL 表达式的最大值。用于判断是否所有行的 TTL 均已过期。

  • rows_where_ttl_info.expression (Array(String)) — 生存时间 (TTL) 表达式。

  • rows_where_ttl_info.min (Array(DateTime)) — 该 part 中计算得到的生存时间 (TTL) 表达式的最小值。用于判断是否至少有一行的生存时间 (TTL) 已过期。

  • rows_where_ttl_info.max (Array(DateTime)) — 该 part 内计算得到的 TTL 表达式的最大值。用于判断是否所有行的生存时间 (TTL) 都已过期。

  • projections (Array(String)) — 为该 part 计算得到的投影名称列表。

  • visible (UInt8) — 指示该数据 part 是否对 SELECT 查询可见的标志。

  • creation_tid (Tuple(UInt64, UInt64, UUID)) — 已创建或正尝试创建此对象的事务 ID。

  • removal_tid_lock (UInt64) — removal_tid 的哈希值,用于在移除对象时对其加锁。

  • removal_tid (Tuple(UInt64, UInt64, UUID)) — 已移除/正尝试移除此对象的事务 ID

  • creation_csn (UInt64) — 创建此对象的事务 CSN

  • removal_csn (UInt64) — 移除此对象的事务 CSN

  • has_lightweight_delete (UInt8) — 指示该 part 是否带有轻量级删除掩码的标志。

  • last_removal_attempt_time (DateTime) — 服务器上次尝试删除此 part 的时间。

  • removal_state (String) — part 删除过程的当前状态。

别名:

  • bytesbytes_on_disk 的别名。
  • marks_sizemarks_bytes 的别名。
  • part_namename 的别名。

示例

SELECT * FROM system.parts LIMIT 1 FORMAT Vertical;
Row 1:
──────
partition:                             tuple()
name:                                  all_1_4_1_6
part_type:                             Wide
active:                                1
marks:                                 2
rows:                                  6
bytes_on_disk:                         310
data_compressed_bytes:                 157
data_uncompressed_bytes:               91
secondary_indices_compressed_bytes:    58
secondary_indices_uncompressed_bytes:  6
secondary_indices_marks_bytes:         48
marks_bytes:                           144
modification_time:                     2020-06-18 13:01:49
remove_time:                           1970-01-01 00:00:00
refcount:                              1
min_date:                              1970-01-01
max_date:                              1970-01-01
min_time:                              1970-01-01 00:00:00
max_time:                              1970-01-01 00:00:00
partition_id:                          all
min_block_number:                      1
max_block_number:                      4
level:                                 1
data_version:                          6
primary_key_bytes_in_memory:           8
primary_key_bytes_in_memory_allocated: 64
is_frozen:                             0
database:                              default
table:                                 months
engine:                                MergeTree
disk_name:                             default
path:                                  /var/lib/clickhouse/data/default/months/all_1_4_1_6/
hash_of_all_files:                     2d0657a16d9430824d35e327fcbd87bf
hash_of_uncompressed_files:            84950cc30ba867c77a408ae21332ba29
uncompressed_hash_of_compressed_files: 1ad78f1c6843bbfb99a2c931abe7df7d
delete_ttl_info_min:                   1970-01-01 00:00:00
delete_ttl_info_max:                   1970-01-01 00:00:00
move_ttl_info.expression:              []
move_ttl_info.min:                     []
move_ttl_info.max:                     []

另请参阅