quantileTDigestWeighted

引入版本：v20.1.0

使用 t-digest 算法计算数值数据序列的近似分位数。该函数会将序列中每个成员的权重考虑在内。

最大误差为 1%。内存消耗为 log(n)，其中 n 是数值的数量。

该函数的性能低于 quantile 或 quantileTiming。就 State 大小与精度的比值而言，该函数远好于 quantile。

结果取决于查询的执行顺序，且是非确定性的。

在一个查询中使用多个具有不同 level 的 quantile* 函数时，其内部状态不会被合并 (也就是说，查询的效率低于理论上的最优情况) 。在这种情况下，请使用 quantiles 函数。

注意

语法

quantileTDigestWeighted(level)(expr, weight)

别名: medianTDigestWeighted

参数

level — 可选。分位数水平。取值为 0 到 1 的常量浮点数。建议将 level 设置在 [0.01, 0.99] 范围内。默认值：0.5。level=0.5 时函数计算的是中位数。Float*

参数说明

expr — 对列值进行运算的表达式，结果为数值类型、Date 或 DateTime。(U)Int* 或 Float* 或 Decimal* 或 Date 或 DateTime
weight — 包含序列元素权重的列。权重是值出现的次数。UInt*

返回值

指定 level 的近似分位数。Float64 或 Date 或 DateTime

示例

使用 t-digest 计算加权分位数

SELECT quantileTDigestWeighted(number, 1) FROM numbers(10);

┌─quantileTDigestWeighted(number, 1)─┐
│                                4.5 │
└────────────────────────────────────┘

另请参阅

quantileTDigestWeighted​