Перейти к основному содержимому
Перейти к основному содержимому

Анонимные данные веб-аналитики

Этот набор данных состоит из двух таблиц с анонимными данными веб-аналитики с хитами (hits_v1) и визитами (visits_v1).

Таблицы можно загрузить в виде сжатых файлов tsv.xz. В дополнение к образцу, рассмотренному в этом документе, доступна расширенная (7.5 ГБ) версия таблицы hits, которая содержит 100 миллионов строк, в формате TSV по ссылке.

Загрузка и прием данных

Загрузка сжатого TSV файла хитовой таблицы:

Создание базы данных и таблицы

Для hits_v1

Или для hits_100m_obfuscated

Импорт данных с хитами:

Проверьте количество строк

Загрузка сжатого TSV файла визитов:

Создание таблицы визитов

Импорт данных визитов

Проверьте количество

Пример JOIN

Набор данных хит и визиты используется в тестовых процедурах ClickHouse, это один из запросов из тестового набора. Остальные тесты упоминаются в разделе Следующие шаги в конце этой страницы.

Следующие шаги

Практическое введение в разреженные первичные индексы в ClickHouse использует набор данных хитов, чтобы обсудить различия в индексации ClickHouse по сравнению с традиционными реляционными базами данных, как ClickHouse строит и использует разреженный первичный индекс, и лучшие практики индексации.

Дополнительные примеры запросов к этим таблицам можно найти среди состояний тестов.

примечание

Тестовый набор использует имя базы данных test, и таблицы называются hits и visits. Вы можете переименовать вашу базу данных и таблицы или отредактировать SQL из тестового файла.