Перейти к основному содержанию
Перейти к основному содержанию

quantileExactWeightedInterpolated

Вычисляет квантиль числовой последовательности данных с использованием линейной интерполяции с учётом веса каждого элемента.

Чтобы получить интерполированное значение, все переданные значения объединяются в массив и сортируются по соответствующим весам. Далее интерполяция квантилей выполняется с использованием метода взвешенного перцентиля: строится кумулятивное распределение на основе весов, после чего на основе весов и значений выполняется линейная интерполяция для вычисления квантилей.

При использовании нескольких функций quantile* с разными уровнями в запросе их внутренние состояния не объединяются (то есть запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantiles.

Мы настоятельно рекомендуем использовать quantileExactWeightedInterpolated вместо quantileInterpolatedWeighted, потому что quantileExactWeightedInterpolated более точен, чем quantileInterpolatedWeighted. Ниже приведён пример:

SELECT
    quantileExactWeightedInterpolated(0.99)(number, 1),
    quantile(0.99)(number),
    quantileInterpolatedWeighted(0.99)(number, 1)
FROM numbers(9)
┌─quantileExactWeightedInterpolated(0.99)(number, 1)─┬─quantile(0.99)(number)─┬─quantileInterpolatedWeighted(0.99)(number, 1)─┐
│                                               7.92 │                   7.92 │                                             8 │
└────────────────────────────────────────────────────┴────────────────────────┴───────────────────────────────────────────────┘

Синтаксис

quantileExactWeightedInterpolated(level)(expr, weight)

Псевдоним: medianExactWeightedInterpolated.

Аргументы

  • level — уровень квантиля. Необязательный параметр. Константное число с плавающей запятой от 0 до 1. Рекомендуется использовать значение level в диапазоне [0.01, 0.99]. Значение по умолчанию: 0.5. При level=0.5 функция вычисляет медиану.
  • expr — выражение над значениями столбца, результатом которого являются числовые типы данных, Date или DateTime.
  • weight — столбец с весами элементов последовательности. Вес — это количество вхождений значения, задаваемое беззнаковыми целочисленными типами.

Возвращаемое значение

  • Квантиль указанного уровня.

Тип:

  • Float64 для числового типа данных на входе.
  • Date, если входные значения имеют тип Date.
  • DateTime, если входные значения имеют тип DateTime.

Пример

Исходная таблица:

┌─n─┬─val─┐
│ 0 │   3 │
│ 1 │   2 │
│ 2 │   1 │
│ 5 │   4 │
└───┴─────┘

Результат:

┌─quantileExactWeightedInterpolated(n, val)─┐
│                                       1.5 │
└───────────────────────────────────────────┘

См. также