approx_top_k
Возвращает массив примерно самых частотных значений и их количеств в указанном столбце. Полученный массив отсортирован в порядке убывания приблизительной частоты значений (не по самим значениям).
Эта функция не предоставляет гарантированный результат. В определенных ситуациях могут возникнуть ошибки, и она может вернуть частотные значения, которые не являются самыми частотными.
Рекомендуем использовать значение N < 10
; производительность снижается при больших значениях N
. Максимальное значение N = 65536
.
Параметры
N
— Количество элементов, которые необходимо вернуть. Необязательно. Значение по умолчанию: 10.reserved
— Определяет, сколько ячеек зарезервировано для значений. Если uniq(column) > reserved, результат функции topK будет приблизительным. Необязательно. Значение по умолчанию: N * 3.
Аргументы
column
— Значение для вычисления частоты.
Пример
Запрос:
Результат:
approx_top_count
Является псевдонимом функции approx_top_k
.
См. также