uniqTheta
Theta Sketch Framework を使用して、異なる引数値のおおよその個数を計算します。
引数
この関数は可変個のパラメータを受け取ります。パラメータには Tuple、Array、Date、DateTime、String、または数値型を指定できます。
戻り値
- UInt64 型の数値。
実装の詳細
関数は次のように動作します:
-
集約内のすべてのパラメータに対してハッシュ値を計算し、そのハッシュを計算に利用します。
-
KMV アルゴリズムを使用して、異なる引数値の個数を近似します。
4096 (2^12) 個の 64 ビットスケッチが使用されます。状態のサイズは約 41 KB です。
-
相対誤差は 3.125%(95% 信頼水準)です。詳細は relative error table を参照してください。
関連項目