approx_top_k
指定されたカラムにおいて、おおよそ最も頻出する値とその出現回数からなる配列を返します。結果の配列は、値そのものではなく、値の推定頻度に基づいて高い順にソートされます。
この関数の結果は保証されません。特定の状況ではエラーが発生する場合があり、最頻値ではない値を頻出値として返すことがあります。
N = 65536 が最大値です。
パラメータ
N— 返す要素数。省略可能。デフォルト値: 10。reserved— 値のために予約するセルの数を定義します。uniq(column) > reserved の場合、topK 関数の結果は近似値になります。省略可能。デフォルト値: N * 3。
引数
column— 出現頻度を計算する対象のカラム。
例
クエリ:
結果:
approx_top_count
approx_top_k 関数のエイリアスです。
関連項目