跳到主要内容
跳到主要内容

quantileTimingWeighted

在给定精度下,根据序列中每个元素的权重,计算数值数据序列的分位数

结果是确定的(不依赖于查询的处理顺序)。该函数针对描述分布的序列进行了优化,例如网页加载时间或后端响应时间。

在一个查询中使用多个具有不同分位水平的 quantile* 函数时,其内部状态不会被合并(也就是说,该查询的执行效率会低于理论最优)。在这种情况下,请使用 quantiles 函数。

语法

quantileTimingWeighted(level)(expr, weight)

别名:medianTimingWeighted

参数

  • level — 分位数的级别。可选参数。0 到 1 之间的常量浮点数。建议使用 [0.01, 0.99] 范围内的 level 值。默认值:0.5。当 level=0.5 时,函数计算中位数

  • expr — 针对列值的表达式,返回 Float* 类型的数值。

    • 如果向函数传递负值,其行为未定义。
    • 如果值大于 30,000(页面加载时间超过 30 秒),则将其视为 30,000。
  • weight — 包含序列元素权重的列。权重是该值出现的次数。

精度

在以下情况下,计算是精确的:

  • 值的总数量不超过 5670。
  • 值的总数量超过 5670,但页面加载时间小于 1024 毫秒。

否则,计算结果将四舍五入到最接近的 16 毫秒的倍数。

:::note
对于页面加载时间分位数的计算,此函数比 quantile 更高效且更精确。 :::

返回值

  • 指定级别的分位数。

类型:Float32

:::note
如果没有向函数传递任何值(在使用 quantileTimingIf 时),则返回 NaN。这样做的目的是将这些情况与结果为零的情况区分开来。有关 NaN 值排序的说明,请参阅 ORDER BY 子句。 :::

示例

输入表:

┌─response_time─┬─weight─┐
│            68 │      1 │
│           104 │      2 │
│           112 │      3 │
│           126 │      2 │
│           138 │      1 │
│           162 │      1 │
└───────────────┴────────┘

查询:

SELECT quantileTimingWeighted(response_time, weight) FROM t

结果:

┌─quantileTimingWeighted(response_time, weight)─┐
│                                           112 │
└───────────────────────────────────────────────┘

quantilesTimingWeighted

quantileTimingWeighted 相同,但接受多个带有分位数水平的参数,并返回一个数组,其中包含这些分位数对应的多个值。

示例

输入表:

┌─response_time─┬─weight─┐
│            68 │      1 │
│           104 │      2 │
│           112 │      3 │
│           126 │      2 │
│           138 │      1 │
│           162 │      1 │
└───────────────┴────────┘

查询:

SELECT quantilesTimingWeighted(0,5, 0.99)(response_time, weight) FROM t

结果:

┌─quantilesTimingWeighted(0.5, 0.99)(response_time, weight)─┐
│ [112,162]                                                 │
└───────────────────────────────────────────────────────────┘

另请参阅