quantileGK
Вычисляет квантиль числовой последовательности данных с использованием алгоритма Гринвальда-Ханны. Алгоритм Гринвальда-Ханны используется для вычисления квантилей на потоке данных с высокой эффективностью. Он был представлен Майклом Гринвальдом и Санжи П. Ханной в 2001 году. Широко используется в базах данных и системах больших данных, где необходимо вычисление точных квантилей для большого потока данных в реальном времени. Алгоритм обладает высокой эффективностью, требуя всего O(log n) места и O(log log n) времени на элемент (где n — размер входных данных). Он также очень точен, обеспечивая приближенное значение квантили с высокой вероятностью.
quantileGK
отличается от других функций квантиля в ClickHouse тем, что позволяет пользователю контролировать точность приближенного результата квантиля.
Синтаксис
Псевдоним: medianGK
.
Аргументы
-
accuracy
— Точность квантили. Константа положительное целое число. Более высокое значение точности означает меньшую погрешность. Например, если аргумент точности установлен на 100, вычисленный квантиль будет иметь погрешность не более 1% с высокой вероятностью. Существует компромисс между точностью вычисленных квантилей и вычислительной сложностью алгоритма. Более высокая точность требует больше памяти и вычислительных ресурсов для неточного вычисления квантиля, в то время как меньший аргумент точности позволяет более быструю и экономичную по памяти оценку, но с немного меньшей точностью. -
level
— Уровень квантили. Необязательный параметр. Константа с плавающей запятой от 0 до 1. Значение по умолчанию: 0.5. Приlevel=0.5
функция вычисляет медиану. -
expr
— Выражение по значениям столбца, результирующее в числовые типы данных, Date или DateTime.
Возвращаемое значение
- Квантиль указанного уровня и точности.
Тип:
- Float64 для входных данных числового типа.
- Date, если входные значения имеют тип
Date
. - DateTime, если входные значения имеют тип
DateTime
.
Пример
Смотрите также
- [median]/sql-reference/aggregate-functions/reference/median
- quantiles