Merge 表引擎
Merge 引擎(不要与 MergeTree 混淆)自身不存储数据,而是允许同时从任意数量的其他表中读取数据。
读取会自动并行执行。不支持向该表写入数据。读取时,如果被实际读取的表存在索引,则会使用这些索引。
创建表
引擎参数
db_name
db_name — 可能的取值包括:
- 数据库名称,
- 返回数据库名称字符串的常量表达式,例如
currentDatabase(), REGEXP(expression),其中expression是用于匹配数据库名称的正则表达式。
tables_regexp
tables_regexp — 用于在指定数据库(单个或多个)中匹配表名的正则表达式。
正则表达式引擎 — re2(支持 PCRE 的子集),区分大小写。 关于在正则表达式中转义字符的说明,请参见 “match” 部分。
使用方法
在选择要读取的表时,即使 Merge 表名本身匹配正则表达式,也不会被选中。这是为了避免形成循环。
确实可以创建两个 Merge 表,让它们无休止地尝试互相读取数据,但这并不是一个好主意。
Merge 引擎的典型用法是将大量 TinyLog 表当作一张表来处理。
示例
示例 1
假设有两个数据库 ABC_corporate_site 和 ABC_store。all_visitors 表将包含这两个数据库中各自 visitors 表里的 ID。
示例 2
假设你有一个旧表 WatchLog_old,并决定更改分区方式,但不将数据迁移到新表 WatchLog_new,同时还需要查看这两个表中的数据。
虚拟列
-
_table— 读取数据的表名。类型:String。如果在
_table上进行过滤(例如WHERE _table='xyz'),则只会从满足过滤条件的表中读取数据。 -
_database— 读取数据的数据库名。类型:String。
另请参阅