Перейти к основному содержимому
Перейти к основному содержимому

quantileTDigestWeighted

Вычисляет приблизительный квантиль числовой последовательности данных с использованием алгоритма t-digest. Функция учитывает вес каждого элемента последовательности. Максимальная ошибка составляет 1%. Потребление памяти составляет log(n), где n — количество значений.

Производительность функции ниже, чем производительность quantile или quantileTiming. В отношении соотношения размера состояния к точности эта функция гораздо лучше, чем quantile.

Результат зависит от порядка выполнения запроса и является недетерминированным.

При использовании нескольких функций quantile* с разными уровнями в одном запросе внутренние состояния не комбинируются (то есть запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantiles.

примечание

Использование quantileTDigestWeighted не рекомендуется для малых наборов данных и может привести к значительной ошибке. В этом случае рассмотрите возможность использования quantileTDigest вместо.

Синтаксис

Псевдоним: medianTDigestWeighted.

Аргументы

  • level — Уровень квантиля. Необязательный параметр. Константное число с плавающей точкой от 0 до 1. Рекомендуется использовать значение level в диапазоне [0.01, 0.99]. Значение по умолчанию: 0.5. При level=0.5 функция вычисляет медиану.
  • expr — Выражение над значениями столбца, приводящее к числовым типам данных, Date или DateTime.
  • weight — Столбец с весами элементов последовательности. Вес — это количество вхождений значения.

Возвращаемое значение

  • Приблизительный квантиль указанного уровня.

Тип:

  • Float64 для входных данных числового типа.
  • Date если входные значения имеют тип Date.
  • DateTime если входные значения имеют тип DateTime.

Пример

Запрос:

Результат:

Смотрите также