跳到主要内容
跳到主要内容

ALTER TABLE ... MODIFY QUERY 语句

您可以使用 ALTER TABLE ... MODIFY QUERY 语句修改创建 物化视图 时指定的 SELECT 查询,而不会中断数据摄取过程。

此命令用于修改通过 TO [db.]name 子句创建的物化视图。它不会更改底层存储表的结构,也不会更改该物化视图的列定义,因此,对于未使用 TO [db.]name 子句创建的物化视图,此命令的适用范围非常有限。

使用 TO 表的示例

CREATE TABLE events (ts DateTime, event_type String)
ENGINE = MergeTree ORDER BY (event_type, ts);

CREATE TABLE events_by_day (ts DateTime, event_type String, events_cnt UInt64)
ENGINE = SummingMergeTree ORDER BY (event_type, ts);

CREATE MATERIALIZED VIEW mv TO events_by_day AS
SELECT toStartOfDay(ts) ts, event_type, count() events_cnt
FROM events
GROUP BY ts, event_type;

INSERT INTO events
SELECT DATE '2020-01-01' + interval number * 900 second,
       ['imp', 'click'][number%2+1]
FROM numbers(100);

SELECT ts, event_type, sum(events_cnt)
FROM events_by_day
GROUP BY ts, event_type
ORDER BY ts, event_type;

┌──────────────────ts─┬─event_type─┬─sum(events_cnt)─┐
│ 2020-01-01 00:00:00 │ click      │              48 │
│ 2020-01-01 00:00:00 │ imp        │              48 │
│ 2020-01-02 00:00:00 │ click      │               2 │
│ 2020-01-02 00:00:00 │ imp        │               2 │
└─────────────────────┴────────────┴─────────────────┘

-- 让我们添加新的指标 `cost`
-- 以及新的维度 `browser`。

ALTER TABLE events
  ADD COLUMN browser String,
  ADD COLUMN cost Float64;

-- 物化视图与 TO(目标表)中的列不必一一对应,
-- 因此接下来的 ALTER 操作不会导致插入失败。

ALTER TABLE events_by_day
    ADD COLUMN cost Float64,
    ADD COLUMN browser String after event_type,
    MODIFY ORDER BY (event_type, ts, browser);

INSERT INTO events
SELECT Date '2020-01-02' + interval number * 900 second,
       ['imp', 'click'][number%2+1],
       ['firefox', 'safary', 'chrome'][number%3+1],
       10/(number+1)%33
FROM numbers(100);

-- 新增的 `browser` 和 `cost` 列仍然为空,因为我们尚未修改物化视图。

SELECT ts, event_type, browser, sum(events_cnt) events_cnt, round(sum(cost),2) cost
FROM events_by_day
GROUP BY ts, event_type, browser
ORDER BY ts, event_type;

┌──────────────────ts─┬─event_type─┬─browser─┬─events_cnt─┬─cost─┐
│ 2020-01-01 00:00:00 │ click      │         │         48 │    0 │
│ 2020-01-01 00:00:00 │ imp        │         │         48 │    0 │
│ 2020-01-02 00:00:00 │ click      │         │         50 │    0 │
│ 2020-01-02 00:00:00 │ imp        │         │         50 │    0 │
│ 2020-01-03 00:00:00 │ click      │         │          2 │    0 │
│ 2020-01-03 00:00:00 │ imp        │         │          2 │    0 │
└─────────────────────┴────────────┴─────────┴────────────┴──────┘

ALTER TABLE mv MODIFY QUERY
  SELECT toStartOfDay(ts) ts, event_type, browser,
  count() events_cnt,
  sum(cost) cost
  FROM events
  GROUP BY ts, event_type, browser;

INSERT INTO events SELECT Date '2020-01-03' + interval number * 900 second, ['imp', 'click'][number%2+1], ['firefox', 'safary', 'chrome'][number%3+1], 10/(number+1)%33 FROM numbers(100);

SELECT ts, event_type, browser, sum(events_cnt) events_cnt, round(sum(cost),2) cost FROM events_by_day GROUP BY ts, event_type, browser ORDER BY ts, event_type;

┌──────────────────ts─┬─event_type─┬─browser─┬─events_cnt─┬──cost─┐ │ 2020-01-01 00:00:00 │ click │ │ 48 │ 0 │ │ 2020-01-01 00:00:00 │ imp │ │ 48 │ 0 │ │ 2020-01-02 00:00:00 │ click │ │ 50 │ 0 │ │ 2020-01-02 00:00:00 │ imp │ │ 50 │ 0 │ │ 2020-01-03 00:00:00 │ click │ firefox │ 16 │ 6.84 │ │ 2020-01-03 00:00:00 │ click │ │ 2 │ 0 │ │ 2020-01-03 00:00:00 │ click │ safary │ 16 │ 9.82 │ │ 2020-01-03 00:00:00 │ click │ chrome │ 16 │ 5.63 │ │ 2020-01-03 00:00:00 │ imp │ │ 2 │ 0 │ │ 2020-01-03 00:00:00 │ imp │ firefox │ 16 │ 15.14 │ │ 2020-01-03 00:00:00 │ imp │ safary │ 16 │ 6.14 │ │ 2020-01-03 00:00:00 │ imp │ chrome │ 16 │ 7.89 │ │ 2020-01-04 00:00:00 │ click │ safary │ 1 │ 0.1 │ │ 2020-01-04 00:00:00 │ click │ firefox │ 1 │ 0.1 │ │ 2020-01-04 00:00:00 │ imp │ firefox │ 1 │ 0.1 │ │ 2020-01-04 00:00:00 │ imp │ chrome │ 1 │ 0.1 │ └─────────────────────┴────────────┴─────────┴────────────┴───────┘

-- !!! 在执行 MODIFY ORDER BY 时,隐式引入了 PRIMARY KEY。

SHOW CREATE TABLE events_by_day FORMAT TSVRaw

CREATE TABLE test.events_by_day ( ts DateTime, event_type String, browser String, events_cnt UInt64, cost Float64 ) ENGINE = SummingMergeTree PRIMARY KEY (event_type, ts) ORDER BY (event_type, ts, browser) SETTINGS index_granularity = 8192

-- !!! 列定义未更改,但这无关紧要,我们查询的不是 -- 物化视图(MATERIALIZED VIEW),而是 TO(存储)表。 -- SELECT 子句已更新。

SHOW CREATE TABLE mv FORMAT TSVRaw;

CREATE MATERIALIZED VIEW test.mv TO test.events_by_day ( ts DateTime, event_type String, events_cnt UInt64 ) AS SELECT toStartOfDay(ts) AS ts, event_type, browser, count() AS events_cnt, sum(cost) AS cost FROM test.events GROUP BY ts, event_type, browser


**不使用 TO 表的示例**

该应用程序功能非常受限,因为只能修改 `SELECT` 子句,无法添加新的列。
CREATE TABLE src_table (`a` UInt32) ENGINE = MergeTree ORDER BY a;
CREATE MATERIALIZED VIEW mv (`a` UInt32) ENGINE = MergeTree ORDER BY a AS SELECT a FROM src_table;
INSERT INTO src_table (a) VALUES (1), (2);
SELECT * FROM mv;
┌─a─┐
│ 1 │
│ 2 │
└───┘
ALTER TABLE mv MODIFY QUERY SELECT a * 2 as a FROM src_table;
INSERT INTO src_table (a) VALUES (3), (4);
SELECT * FROM mv;
┌─a─┐
│ 6 │
│ 8 │
└───┘
┌─a─┐
│ 1 │
│ 2 │
└───┘

ALTER TABLE ... MODIFY REFRESH 语句

ALTER TABLE ... MODIFY REFRESH 语句用于修改 可刷新物化视图 的刷新参数。参见更改刷新参数