anyHeavy
使用 heavy hitters 算法选取一个高频出现的值。
如果存在某个值在查询的每个执行线程中出现的次数都超过该线程所处理记录数的一半,则返回该值。
通常,该结果是不确定的。
参数
column– 列名。
示例
以 OnTime 数据集为例,从 AirlineID 列中选择任意一个经常出现的值。
使用 heavy hitters 算法选取一个高频出现的值。
如果存在某个值在查询的每个执行线程中出现的次数都超过该线程所处理记录数的一半,则返回该值。
通常,该结果是不确定的。
anyHeavy(column)
参数
column – 列名。示例
以 OnTime 数据集为例,从 AirlineID 列中选择任意一个经常出现的值。
SELECT anyHeavy(AirlineID) AS res
FROM ontime
┌───res─┐
│ 19690 │
└───────┘
Was this page helpful?