跳到主要内容
跳到主要内容

sumMap

根据 key 数组中指定的键,对一个或多个 value 数组进行求和。返回一个由数组组成的元组:第一个数组是排好序的键,后续数组是对应键的求和值,且不会发生溢出。

语法

  • sumMap(key <Array>, value1 <Array>[, value2 <Array>, ...]) Array 类型
  • sumMap(Tuple(key <Array>[, value1 <Array>, value2 <Array>, ...])) Tuple 类型

别名:sumMappedArrays

参数

  • key:键的 Array
  • value1value2、…:需要对每个键求和的值的 Array

传入一个由键数组和值数组组成的 tuple,与分别传入一个键数组和若干值数组是等价的。

注意

对于每一行参与汇总的数据,key 和所有 value 数组中的元素个数必须相同。

返回值

  • 返回一个由数组组成的元组:第一个数组包含排好序的键,后续数组包含对应键的求和值。

示例

首先,我们创建一张名为 sum_map 的表,并向其中插入一些数据。键和值的数组分别存储在名为 statusMapNested 类型列中,同时也以名为 statusMapTupletuple 类型列合并存储,用于演示上文所述此函数两种不同语法的用法。

查询:

CREATE TABLE sum_map(
    date Date,
    timeslot DateTime,
    statusMap Nested(
        status UInt16,
        requests UInt64
    ),
    statusMapTuple Tuple(Array(Int32), Array(Int32))
) ENGINE = Log;
INSERT INTO sum_map VALUES
    ('2000-01-01', '2000-01-01 00:00:00', [1, 2, 3], [10, 10, 10], ([1, 2, 3], [10, 10, 10])),
    ('2000-01-01', '2000-01-01 00:00:00', [3, 4, 5], [10, 10, 10], ([3, 4, 5], [10, 10, 10])),
    ('2000-01-01', '2000-01-01 00:01:00', [4, 5, 6], [10, 10, 10], ([4, 5, 6], [10, 10, 10])),
    ('2000-01-01', '2000-01-01 00:01:00', [6, 7, 8], [10, 10, 10], ([6, 7, 8], [10, 10, 10]));

接下来,我们使用 sumMap 函数查询该表,同时采用数组和元组类型这两种语法形式:

查询:

SELECT
    timeslot,
    sumMap(statusMap.status, statusMap.requests),
    sumMap(statusMapTuple)
FROM sum_map
GROUP BY timeslot

结果:

┌────────────timeslot─┬─sumMap(statusMap.status, statusMap.requests)─┬─sumMap(statusMapTuple)─────────┐
│ 2000-01-01 00:00:00 │ ([1,2,3,4,5],[10,10,20,10,10])               │ ([1,2,3,4,5],[10,10,20,10,10]) │
│ 2000-01-01 00:01:00 │ ([4,5,6,7,8],[10,10,20,10,10])               │ ([4,5,6,7,8],[10,10,20,10,10]) │
└─────────────────────┴──────────────────────────────────────────────┴────────────────────────────────┘

包含多个值数组的示例

sumMap 也支持同时对多个值数组进行聚合。 当存在共享相同键的相关指标时,这会非常有用。

CREATE TABLE multi_metrics(
    date Date,
    browser_metrics Nested(
        browser String,
        impressions UInt32,
        clicks UInt32
    )
)
ENGINE = MergeTree()
ORDER BY tuple();

INSERT INTO multi_metrics VALUES
    ('2000-01-01', ['Firefox', 'Chrome'], [100, 200], [10, 25]),
    ('2000-01-01', ['Chrome', 'Safari'], [150, 50], [20, 5]),
    ('2000-01-01', ['Firefox', 'Edge'], [80, 40], [8, 4]);

SELECT 
    sumMap(browser_metrics.browser, browser_metrics.impressions, browser_metrics.clicks) AS result
FROM multi_metrics;
┌─result────────────────────────────────────────────────────────────────────────┐
│ (['Chrome', 'Edge', 'Firefox', 'Safari'], [350, 40, 180, 50], [45, 4, 18, 5]) │
└───────────────────────────────────────────────────────────────────────────────┘

在此示例中:

  • 结果元组包含三个数组
  • 第一个数组:按排序后的键(浏览器名称)
  • 第二个数组:每个浏览器的总展示次数
  • 第三个数组:每个浏览器的总点击次数

另请参阅