跳到主要内容
跳到主要内容

quantileTDigest

使用 t-digest 算法,对数值数据序列计算近似的分位数

内存消耗为 log(n),其中 n 为值的数量。结果取决于查询的执行顺序,因此是非确定性的。

该函数的性能低于 quantilequantileTiming。从状态大小与精度之间的比率来看,该函数要比 quantile 好得多。

在一个查询中使用多个具有不同 level 的 quantile* 函数时,其内部状态不会被合并(也就是说,查询的执行效率低于理论可达的效率)。在这种情况下,请使用 quantiles 函数。

语法

quantileTDigest(level)(expr)

别名:medianTDigest

参数

  • level — 分位数水平。可选参数。取值为 0 到 1 之间的常量浮点数。建议将 level 设置在 [0.01, 0.99] 范围内。默认值:0.5。当 level=0.5 时,函数计算中位数
  • expr — 基于列值的表达式,其结果为数值数据类型DateDateTime

返回值

  • 给定水平的近似分位数。

类型:

  • 对于数值数据类型输入,返回 Float64
  • 如果输入值为 Date 类型,则返回 Date
  • 如果输入值为 DateTime 类型,则返回 DateTime

示例

查询:

SELECT quantileTDigest(number) FROM numbers(10)

结果:

┌─quantileTDigest(number)─┐
│                     4.5 │
└─────────────────────────┘

另请参阅