Перейти к основному содержимому
Перейти к основному содержимому

Функции quantileExact

quantileExact

Точно вычисляет квантили последовательности числовых данных.

Для получения точного значения все переданные значения объединяются в массив, который затем частично сортируется. Поэтому функция потребляет O(n) памяти, где n — это количество переданных значений. Тем не менее, для небольшого количества значений функция очень эффективна.

При использовании нескольких функций quantile* с различными уровнями в запросе, внутренние состояния не объединяются (то есть, запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantiles.

Синтаксис

Псевдоним: medianExact.

Аргументы

  • level — Уровень квантили. Необязательный параметр. Константное вещественное число от 0 до 1. Рекомендуется использовать значение level в диапазоне [0.01, 0.99]. Значение по умолчанию: 0.5. При level=0.5 функция вычисляет медину.
  • expr — Выражение над значениями столбца, результатом которого являются числовые типы данных, Date или DateTime.

Возвращаемое значение

  • Квантиль заданного уровня.

Тип:

  • Для числовых типов данных выходной формат будет таким же, как и входной. Например:
  • Date, если входные значения имеют тип Date.
  • DateTime, если входные значения имеют тип DateTime.

Пример

Запрос:

Результат:

quantileExactLow

Аналогично quantileExact, вычисляет точный квантиль последовательности числовых данных.

Для получения точного значения все переданные значения объединяются в массив, который затем полностью сортируется. Комплексность алгоритма сортировки составляет O(N·log(N)), где N = std::distance(first, last) сравнений.

Возвращаемое значение зависит от уровня квантили и количества элементов в выборке, т.е. если уровень равен 0.5, то функция возвращает нижнее медианное значение для четного числа элементов и среднее медианное значение для нечетного числа элементов. Медиана вычисляется аналогично реализации median_low, которая используется в Python.

Для всех остальных уровней возвращается элемент по индексу, соответствующему значению level * size_of_array. Например:

При использовании нескольких функций quantile* с различными уровнями в запросе, внутренние состояния не комбинируются (то есть, запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantiles функцию.

Синтаксис

Псевдоним: medianExactLow.

Аргументы

  • level — Уровень квантили. Необязательный параметр. Константное вещественное число от 0 до 1. Мы рекомендуем использовать значение level в диапазоне [0.01, 0.99]. Значение по умолчанию: 0.5. При level=0.5 функция вычисляет медину.
  • expr — Выражение над значениями столбца, результатом которого являются числовые типы данных, Date или DateTime.

Возвращаемое значение

  • Квантиль заданного уровня.

Тип:

  • Float64 для числового типа данных входа.
  • Date, если входные значения имеют тип Date.
  • DateTime, если входные значения имеют тип DateTime.

Пример

Запрос:

Результат:

quantileExactHigh

Аналогично quantileExact, вычисляет точный квантиль последовательности числовых данных.

Все переданные значения объединяются в массив, который затем полностью сортируется для получения точного значения. Комплексность алгоритма сортировки составляет O(N·log(N)), где N = std::distance(first, last) сравнений.

Возвращаемое значение зависит от уровня квантили и количества элементов в выборке, т.е. если уровень равен 0.5, то функция возвращает верхнее медианное значение для четного числа элементов и среднее медианное значение для нечетного числа элементов. Медиана вычисляется аналогично реализации median_high, которая используется в Python. Для всех остальных уровней возвращается элемент по индексу, соответствующему значению level * size_of_array.

Эта реализация ведет себя аналогично текущей реализации quantileExact.

При использовании нескольких функций quantile* с различными уровнями в запросе, внутренние состояния не объединяются (то есть, запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantiles.

Синтаксис

Псевдоним: medianExactHigh.

Аргументы

  • level — Уровень квантили. Необязательный параметр. Константное вещественное число от 0 до 1. Мы рекомендуем использовать значение level в диапазоне [0.01, 0.99]. Значение по умолчанию: 0.5. При level=0.5 функция вычисляет медину.
  • expr — Выражение над значениями столбца, результатом которого являются числовые типы данных, Date или DateTime.

Возвращаемое значение

  • Квантиль заданного уровня.

Тип:

  • Float64 для числового типа данных входа.
  • Date, если входные значения имеют тип Date.
  • DateTime, если входные значения имеют тип DateTime.

Пример

Запрос:

Результат:

quantileExactExclusive

Точно вычисляет квантили последовательности числовых данных.

Для получения точного значения все переданные значения объединяются в массив, который затем частично сортируется. Поэтому функция потребляет O(n) памяти, где n — это количество переданных значений. Тем не менее, для небольшого количества значений функция очень эффективна.

Эта функция эквивалентна функции PERCENTILE.EXC в Excel, (тип R6).

При использовании нескольких функций quantileExactExclusive с различными уровнями в запросе, внутренние состояния не объединяются (то есть, запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantilesExactExclusive функцию.

Синтаксис

Аргументы

  • expr — Выражение над значениями столбца, результатом которого являются числовые типы данных, Date или DateTime.

Параметры

  • level — Уровень квантили. Необязательный. Возможные значения: (0, 1) — границы не включены. Значение по умолчанию: 0.5. При level=0.5 функция вычисляет медину. Float.

Возвращаемое значение

  • Квантиль заданного уровня.

Тип:

  • Float64 для числового типа данных входа.
  • Date, если входные значения имеют тип Date.
  • DateTime, если входные значения имеют тип DateTime.

Пример

Запрос:

Результат:

quantileExactInclusive

Точно вычисляет квантили последовательности числовых данных.

Для получения точного значения все переданные значения объединяются в массив, который затем частично сортируется. Поэтому функция потребляет O(n) памяти, где n — это количество переданных значений. Тем не менее, для небольшого количества значений функция очень эффективна.

Эта функция эквивалентна функции PERCENTILE.INC в Excel, (тип R7).

При использовании нескольких функций quantileExactInclusive с различными уровнями в запросе, внутренние состояния не объединяются (то есть, запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantilesExactInclusive функцию.

Синтаксис

Аргументы

  • expr — Выражение над значениями столбца, результатом которого являются числовые типы данных, Date или DateTime.

Параметры

  • level — Уровень квантили. Необязательный. Возможные значения: [0, 1] — границы включены. Значение по умолчанию: 0.5. При level=0.5 функция вычисляет медину. Float.

Возвращаемое значение

  • Квантиль заданного уровня.

Тип:

  • Float64 для числового типа данных входа.
  • Date, если входные значения имеют тип Date.
  • DateTime, если входные значения имеют тип DateTime.

Пример

Запрос:

Результат:

См. Также