quantileTDigestWeighted
数値データ列に対して、t-digest アルゴリズムを用いて近似的な 分位点 を計算します。各要素の重みを考慮します。最大誤差は 1% です。メモリ使用量は log(n) で、n は値の数です。
この関数の性能は quantile や quantileTiming よりも劣ります。State サイズと精度の比率という観点では、この関数は quantile よりも優れています。
結果はクエリの実行順序に依存し、非決定的です。
同一クエリ内でレベルの異なる複数の quantile* 関数を使用する場合、内部状態は結合されません(つまり、そのクエリは本来よりも効率が低下します)。この場合は、quantiles 関数の使用を検討してください。
:::note
quantileTDigestWeighted の使用は、ごく小さいデータセットには推奨されておらず、大きな誤差につながる可能性があります。この場合は、代わりに quantileTDigest の使用を検討してください。
:::
構文
エイリアス: medianTDigestWeighted.
引数
level— 分位数のレベル。省略可能なパラメータ。0 から 1 までの定数の浮動小数点数。levelの値は[0.01, 0.99]の範囲で使用することを推奨します。既定値: 0.5。level=0.5の場合、この関数は中央値を計算します。expr— 数値データ型、Date または DateTime を結果とする、カラム値に対する式。weight— シーケンスの各要素の重みを持つカラム。重みは値の出現回数です。
戻り値
- 指定されたレベルの近似分位数。
型:
例
クエリ:
結果:
関連項目