Перейти к основному содержимому
Перейти к основному содержимому

approx_top_k

Возвращает массив примерно самых частотных значений и их количеств в указанном столбце. Полученный массив отсортирован в порядке убывания приблизительной частоты значений (не по самим значениям).

Эта функция не предоставляет гарантированный результат. В определенных ситуациях могут возникнуть ошибки, и она может вернуть частотные значения, которые не являются самыми частотными.

Рекомендуем использовать значение N < 10; производительность снижается при больших значениях N. Максимальное значение N = 65536.

Параметры

  • N — Количество элементов, которые необходимо вернуть. Необязательно. Значение по умолчанию: 10.
  • reserved — Определяет, сколько ячеек зарезервировано для значений. Если uniq(column) > reserved, результат функции topK будет приблизительным. Необязательно. Значение по умолчанию: N * 3.

Аргументы

  • column — Значение для вычисления частоты.

Пример

Запрос:

Результат:

approx_top_count

Является псевдонимом функции approx_top_k.

См. также