Перейти к основному содержимому
Перейти к основному содержимому

system.asynchronous_metrics

Запросы в ClickHouse Cloud

Данные в этой системной таблице хранятся локально на каждом узле в ClickHouse Cloud. Для получения полного представления о всех данных необходимо использовать функцию clusterAllReplicas. Подробности см. здесь.

Содержит метрики, которые периодически рассчитываются в фоновом режиме. Например, объем используемой оперативной памяти.

Столбцы:

  • metric (String) — Название метрики.
  • value (Float64) — Значение метрики.
  • description (String) — Описание метрики.

Пример

Описания метрик

AsynchronousHeavyMetricsCalculationTimeSpent

Время в секундах, затраченное на расчет асинхронных тяжелых (связанных с таблицами) метрик (это накладные расходы асинхронных метрик).

AsynchronousHeavyMetricsUpdateInterval

Интервал обновления тяжелых (связанных с таблицами) метрик.

AsynchronousMetricsCalculationTimeSpent

Время в секундах, затраченное на расчет асинхронных метрик (это накладные расходы асинхронных метрик).

AsynchronousMetricsUpdateInterval

Интервал обновления метрик.

BlockActiveTime_name

Время в секундах, в течение которого блок-устройство имело очередь запросов IO. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardBytes_name

КоличествоDiscarded bytes на блок-устройстве. Эти операции актуальны для SSD. Операции удаления не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardMerges_name

Количество операций удаления, запрашиваемых с блока и объединяемых ОС-IO планировщиком. Эти операции актуальны для SSD. Операции удаления не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardOps_name

Количество операций удаления, запрашиваемых на блок-устройстве. Эти операции актуальны для SSD. Операции удаления не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardTime_name

Время в секундах, проведенное на операциях удаления, запрашиваемых с блока, суммированное по всем операциям. Эти операции актуальны для SSD. Операции удаления не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockInFlightOps_name

Это значение учитывает число запросов I/O, которые были выданы драйверу устройства, но еще не завершены. Это не включает запросы IO, которые находятся в очереди, но еще не были выданы драйверу устройства. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockQueueTime_name

Это значение учитывает количество миллисекунд, которые запросы IO ожидали на этом блок-устройстве. Если несколько запросов IO ждут, это значение увеличится как произведение числа миллисекунд на количество ожидающих запросов. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadBytes_name

Количество байт, прочитанных с блока-устройства. Это может быть меньше, чем количество байт, прочитанных из файловой системы из-за использования кэша страниц ОС, который экономит IO. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadMerges_name

Количество операций чтения, запрашиваемых с блока-устройства и объединяемых ОС-IO планировщиком. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadOps_name

Количество операций чтения, запрашиваемых с блока-устройства. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadTime_name

Время в секундах, проведенное на операциях чтения, запрашиваемых с блока-устройства, суммированное по всем операциям. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteBytes_name

Количество байт, записанных на блок-устройство. Это может быть меньше, чем количество байт, записанных в файловую систему из-за использования кэша страниц ОС, который экономит IO. Запись на блок-устройство может произойти позже, чем соответствующая запись в файловую систему из-за кэширования записи. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteMerges_name

Количество операций записи, запрашиваемых с блок-устройства и объединяемых ОС-IO планировщиком. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteOps_name

Количество операций записи, запрашиваемых с блок-устройства. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteTime_name

Время в секундах, проведенное на операциях записи, запрашиваемых с блок-устройства, суммированное по всем операциям. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

CPUFrequencyMHz_name

Текущая частота CPU, в МГц. Большинство современных CPU динамически регулируют частоту для экономии энергии и Turbo Boost.

CompiledExpressionCacheBytes

Общее количество байт, используемых для кэша JIT-скомпилированного кода.

CompiledExpressionCacheCount

Общее количество записей в кэше JIT-скомпилированного кода.

DiskAvailable_name

Доступные байты на диске (виртуальная файловая система). Удаленные файловые системы могут показывать большие значения, такие как 16 EiB.

DiskTotal_name

Общий размер в байтах диска (виртуальная файловая система). Удаленные файловые системы могут показывать большие значения, такие как 16 EiB.

DiskUnreserved_name

Доступные байты на диске (виртуальная файловая система) без резервирования для слияний, извлечений и перемещений. Удаленные файловые системы могут показывать большие значения, такие как 16 EiB.

DiskUsed_name

Используемые байты на диске (виртуальная файловая система). Удаленные файловые системы не всегда предоставляют эту информацию.

FilesystemCacheBytes

Общее количество байт в виртуальной файловой системе cache. Этот кэш хранится на диске.

FilesystemCacheFiles

Общее количество сегментов файлов в кэше виртуальной файловой системы cache. Этот кэш хранится на диске.

FilesystemLogsPathAvailableBytes

Доступные байты на разделе, где смонтирован путь журнала ClickHouse. Если это значение приближается к нулю, вам следует настроить ротацию журналов в файле конфигурации.

FilesystemLogsPathAvailableINodes

Количество доступных инодов на разделе, где смонтирован путь журнала ClickHouse.

FilesystemLogsPathTotalBytes

Размер раздела, на котором смонтирован путь журнала ClickHouse, в байтах. Рекомендуется иметь не менее 10 ГБ для журналов.

FilesystemLogsPathTotalINodes

Общее количество инодов на разделе, где смонтирован путь журнала ClickHouse.

FilesystemLogsPathUsedBytes

Используемые байты на разделе, где смонтирован путь журнала ClickHouse.

FilesystemLogsPathUsedINodes

Количество использованных инодов на разделе, где смонтирован путь журнала ClickHouse.

FilesystemMainPathAvailableBytes

Доступные байты на разделе, где смонтирован основной путь ClickHouse.

FilesystemMainPathAvailableINodes

Количество доступных инодов на разделе, где смонтирован основной путь ClickHouse. Если оно близко к нулю, это указывает на неправильную конфигурацию, и вы получите сообщение 'недостаточно места на устройстве', даже когда диск не заполнен.

FilesystemMainPathTotalBytes

Размер раздела, где смонтирован основной путь ClickHouse, в байтах.

FilesystemMainPathTotalINodes

Общее количество инодов на разделе, где смонтирован основной путь ClickHouse. Если оно меньше 25 миллионов, это указывает на неправильную конфигурацию.

FilesystemMainPathUsedBytes

Используемые байты на разделе, где смонтирован основной путь ClickHouse.

FilesystemMainPathUsedINodes

Количество использованных инодов на разделе, где смонтирован основной путь ClickHouse. Это значение в основном соответствует количеству файлов.

HTTPThreads

Количество потоков в сервере HTTP-интерфейса (без TLS).

InterserverThreads

Количество потоков в сервере протокола коммуникации реплик (без TLS).

Jitter

Разница во времени, когда поток для расчета асинхронных метрик был запланирован для пробуждения и времени, когда он фактически проснулся. Прокси-показатель общей задержки и отклика системы.

LoadAverageN

Общая нагрузка системы, усредненная с экспоненциальным сглаживанием за 1 минуту. Нагрузка представляет количество потоков среди всех процессов (сущностей планирования ядра ОС), которые в данный момент выполняются процессором или ожидают IO, или готовы к выполнению, но в данный момент не планируются. Это число включает все процессы, а не только clickhouse-server. Число может превышать количество ядер CPU, если система перегружена, и многие процессы готовы к выполнению, но ожидают CPU или IO.

MMapCacheCells

Количество файлов, открытых с помощью mmap (отображенных в памяти). Это используется для запросов с установленной конфигурацией local_filesystem_read_method, установленной на mmap. Файлы, открытые с помощью mmap, хранятся в кэше, чтобы избежать затратных сбросов TLB.

MarkCacheBytes

Общий размер кэша меток в байтах.

MarkCacheFiles

Общее количество файлов меток в кэше меток.

MaxPartCountForPartition

Максимальное количество частей на раздел для всех разделов всех таблиц семейства MergeTree. Значения больше 300 указывают на неправильную конфигурацию, перегрузку или массовую загрузку данных.

MemoryCode

Общее количество виртуальной памяти, распределенной для страниц машинного кода процесса сервера, в байтах.

MemoryDataAndStack

Количество виртуальной памяти, распределенной для использования стека и для выделенной памяти, в байтах. Не указано, включает ли это стеки на потоках и большую часть выделенной памяти, которая выделяется с помощью системного вызова 'mmap'. Эта метрика существует только по причине полноты. Я рекомендую использовать метрику MemoryResident для мониторинга.

MemoryResidentMax

Максимальное количество физической памяти, используемой процессом сервера, в байтах.

MemoryResident

Количество физической памяти, используемой процессом сервера, в байтах.

MemoryShared

Количество памяти, используемой процессом сервера, которая также используется другими процессами, в байтах. ClickHouse не использует совместно используемую память, но некоторая память может быть обозначена ОС как совместно используемая по своим причинам. Эта метрика не имеет большого смысла для наблюдения и существует только для полноты.

MemoryVirtual

Размер виртуального адресного пространства, выделенного процессом сервера, в байтах. Размер виртуального адресного пространства обычно намного больше, чем потребление физической памяти, и не должен использоваться в качестве оценки потребления памяти. Большие значения этой метрики полностью нормальны и имеют только технический смысл.

MySQLThreads

Количество потоков в сервере протокола совместимости MySQL.

NetworkReceiveBytes_name

Количество байт, полученных через сетевой интерфейс. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkReceiveDrop_name

Количество байт, потерянных пакетом при получении через сетевой интерфейс. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkReceiveErrors_name

Количество раз, когда произошла ошибка во время получения через сетевой интерфейс. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkReceivePackets_name

Количество сетевых пакетов, полученных через сетевой интерфейс. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkSendBytes_name

Количество байт, отправленных через сетевой интерфейс. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkSendDrop_name

Количество раз, когда пакет был потерян при отправке через сетевой интерфейс. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkSendErrors_name

Количество раз, когда произошла ошибка (например, повторная передача TCP) во время отправки через сетевой интерфейс. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkSendPackets_name

Количество сетевых пакетов, отправленных через сетевой интерфейс. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.

NumberOfDatabases

Общее количество баз данных на сервере.

NumberOfDetachedByUserParts

Общее количество частей, открепленных от таблиц MergeTree пользователями с помощью запроса ALTER TABLE DETACH (в отличие от неожиданных, поврежденных или игнорируемых частей). Сервер не заботится об открепленных частях, и они могут быть удалены.

NumberOfDetachedParts

Общее количество частей, открепленных от таблиц MergeTree. Часть может быть откреплена пользователем с помощью запроса ALTER TABLE DETACH или самим сервером в случае, если часть повреждена, неожиданна или не нужна. Сервер не заботится об открепленных частях, и они могут быть удалены.

NumberOfTables

Общее количество таблиц, суммируемое по базам данных на сервере, исключая базы данных, которые не могут содержать таблицы MergeTree. Исключенные движки баз данных — это те, которые создают набор таблиц на лету, такие как Lazy, MySQL, PostgreSQL, SQlite.

OSContextSwitches

Количество переключений контекста, произошедших в системе на хост-машине. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.

OSGuestNiceTime

Соотношение времени, затраченного на выполнение виртуального CPU для гостевых операционных систем под контролем ядра Linux, когда гость был установлен на более высокий приоритет (см. man procfs). Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но все же существует для полноты. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..num cores].

OSGuestNiceTimeCPU_N

Соотношение времени, затраченного на выполнение виртуального CPU для гостевых операционных систем под контролем ядра Linux, когда гость был установлен на более высокий приоритет (см. man procfs). Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но все же существует для полноты. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..num cores].

OSGuestNiceTimeNormalized

Значение аналогично OSGuestNiceTime, но делится на количество ядер CPU, чтобы быть измеряемым в интервале [0..1], независимо от количества ядер. Это позволяет усреднить значения этой метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и все еще получить усредненный показатель использования ресурсов.

OSGuestTime

Соотношение времени, затраченного на выполнение виртуального CPU для гостевых операционных систем под контролем ядра Linux (см. man procfs). Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но все же существует для полноты. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..num cores].

OSGuestTimeCPU_N

Соотношение времени, затраченного на выполнение виртуального CPU для гостевых операционных систем под контролем ядра Linux (см. man procfs). Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но все же существует для полноты. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..num cores].

OSGuestTimeNormalized

Значение аналогично OSGuestTime, но делится на количество ядер CPU, чтобы быть измеряемым в интервале [0..1], независимо от количества ядер. Это позволяет усреднить значения этой метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и все еще получить усредненный показатель использования ресурсов.

OSIOWaitTime

Соотношение времени, в течение которого ядро CPU не выполняло код, но когда ядро ОС не запускало другие процессы на этом CPU, так как процессы ожидали IO. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..num cores].

OSIOWaitTimeCPU_N

Соотношение времени, в течение которого ядро CPU не выполняло код, но когда ядро ОС не запускало другие процессы на этом CPU, так как процессы ожидали IO. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..num cores].

OSIOWaitTimeNormalized

Значение аналогично OSIOWaitTime, но делится на количество ядер CPU, чтобы быть измеряемым в интервале [0..1], независимо от количества ядер. Это позволяет усреднить значения этой метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и все еще получить усредненный показатель использования ресурсов.

OSIdleTime

Соотношение времени, в течение которого ядро CPU было бездействующим (даже не готовым к запуску процесса, ожидающего IO) с точки зрения ядра ОС. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Это не включает время, когда CPU использовался недостаточно из-за причин, внутренних для CPU (загрузки памяти, зависания конвейера, ошибочные прогнозы ветвлений, работа другого SMT-ядра). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..num cores].

OSIdleTimeCPU_N

Соотношение времени, в течение которого ядро CPU было бездействующим (даже не готовым к запуску процесса, ожидающего IO) с точки зрения ядра ОС. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Это не включает время, когда CPU использовался недостаточно из-за причин, внутренних для CPU (загрузки памяти, зависания конвейера, ошибочные прогнозы ветвлений, работа другого SMT-ядра). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..num cores].

OSIdleTimeNormalized

Значение аналогично OSIdleTime, но делится на количество ядер CPU, чтобы быть измеряемым в интервале [0..1], независимо от количества ядер. Это позволяет усреднить значения этой метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и все еще получить усредненный показатель использования ресурсов.

OSInterrupts

Количество прерываний на хост-машине. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.

OSIrqTime

Соотношение времени, затраченного на выполнение аппаратных запросов прерываний на CPU. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неправильную конфигурацию оборудования или очень высокую нагрузку сети. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..num cores].

OSIrqTimeCPU_N

Соотношение времени, затраченного на выполнение аппаратных запросов прерываний на CPU. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неправильную конфигурацию оборудования или очень высокую нагрузку сети. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..num cores].

OSIrqTimeNormalized

Значение аналогично OSIrqTime, но делится на количество ядер CPU, чтобы быть измеряемым в интервале [0..1], независимо от количества ядер. Это позволяет усреднить значения этой метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и все еще получить усредненный показатель использования ресурсов.

OSMemoryAvailable

Количество памяти, доступной для использования программами, в байтах. Это очень похоже на метрику OSMemoryFreePlusCached. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.

OSMemoryBuffers

Количество памяти, используемой буферами ядра ОС, в байтах. Обычно это должно быть небольшим, и большие значения могут указывать на неправильную конфигурацию ОС. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.

OSMemoryCached

Количество памяти, используемой кэшем страниц ОС, в байтах. Обычно почти вся доступная память используется кэшем страниц ОС — высокие значения этой метрики нормальны и ожидаемы. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.

OSMemoryFreePlusCached

Количество свободной памяти плюс память кэша страниц ОС на хост-системе, в байтах. Эта память доступна для использования программами. Значение должно быть очень похоже на OSMemoryAvailable. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.

OSMemoryFreeWithoutCached

Объем свободной памяти на хост-системе в байтах. Это значение не включает память, используемую кешем страниц ОС, в байтах. Память кеша страниц также доступна для использования программами, поэтому значение этой метрики может быть несколько запутанным. Вместо этого смотрите метрику OSMemoryAvailable. Для удобства мы также предоставляем метрику OSMemoryFreePlusCached, которая должна быть похожа на OSMemoryAvailable. Смотрите также https://www.linuxatemyram.com/. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.

OSMemoryTotal

Общее количество памяти на хост-системе в байтах.

OSNiceTime

Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства с более высоким приоритетом. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма этих значений [0..число ядер].

OSNiceTimeCPU_N

Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства с более высоким приоритетом. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма этих значений [0..число ядер].

OSNiceTimeNormalized

Значение похоже на OSNiceTime, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неравномерное, и по-прежнему получать среднюю метрику использования ресурсов.

OSOpenFiles

Общее количество открытых файлов на хост-машине. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.

OSProcessesBlocked

Количество потоков, ожидающих завершения ввода-вывода (man procfs). Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.

OSProcessesCreated

Количество созданных процессов. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.

OSProcessesRunning

Количество потоков, готовых к выполнению (выполняющихся или ожидающих выполнения), по версии операционной системы. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.

OSSoftIrqTime

Соотношение времени, затраченного на выполнение программных прерываний на CPU. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неэффективное программное обеспечение, работащее на системе. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма этих значений [0..число ядер].

OSSoftIrqTimeCPU_N

Соотношение времени, затраченного на выполнение программных прерываний на CPU. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неэффективное программное обеспечение, работающее на системе. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма этих значений [0..число ядер].

OSSoftIrqTimeNormalized

Значение похоже на OSSoftIrqTime, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неравномерное, и по-прежнему получать среднюю метрику использования ресурсов.

OSStealTime

Соотношение времени, затраченного CPU на работу в других операционных системах при работе в виртуализированной среде. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Не каждая виртуализированная среда предоставляет эту метрику, и большинство из них этого не делает. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма этих значений [0..число ядер].

OSStealTimeCPU_N

Соотношение времени, затраченного CPU на работу в других операционных системах при работе в виртуализированной среде. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Не каждая виртуализированная среда предоставляет эту метрику, и большинство из них этого не делает. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма этих значений [0..число ядер].

OSStealTimeNormalized

Значение похоже на OSStealTime, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неравномерное, и по-прежнему получать среднюю метрику использования ресурсов.

OSSystemTime

Соотношение времени, в течение которого ядро CPU выполняло код ядра ОС (системный код). Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма этих значений [0..число ядер].

OSSystemTimeCPU_N

Соотношение времени, в течение которого ядро CPU выполняло код ядра ОС (системный код). Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма этих значений [0..число ядер].

OSSystemTimeNormalized

Значение похоже на OSSystemTime, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неравномерное, и по-прежнему получать среднюю метрику использования ресурсов.

OSThreadsRunnable

Общее количество "выполнимых" потоков, по версии планировщика ядра ОС.

OSThreadsTotal

Общее количество потоков, по версии планировщика ядра ОС.

OSUptime

Время работы хост-сервера (машина, на которой запущен ClickHouse) в секундах.

OSUserTime

Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Это также включает время, когда CPU был частично недозагружен по причинам, внутренним для CPU (загрузки памяти, зависания в конвейере, неверные предсказания ветвлений, работа другого ядра SMT). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма этих значений [0..число ядер].

OSUserTimeCPU_N

Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Это также включает время, когда CPU был частично недозагружен по причинам, внутренним для CPU (загрузки памяти, зависания в конвейере, неверные предсказания ветвлений, работа другого ядра SMT). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма этих значений [0..число ядер].

OSUserTimeNormalized

Значение похоже на OSUserTime, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неравномерное, и по-прежнему получать среднюю метрику использования ресурсов.

PostgreSQLThreads

Количество потоков на сервере протокола совместимости PostgreSQL.

QueryCacheBytes

Общий размер кэша запросов в байтах.

QueryCacheEntries

Общее количество записей в кэше запросов.

ReplicasMaxAbsoluteDelay

Максимальная разница в секундах между самой свежей реплицированной частью и самой свежей частью данных, которая еще не была реплицирована, по всем реплицированным таблицам. Очень высокое значение указывает на реплику без данных.

ReplicasMaxInsertsInQueue

Максимальное количество операций INSERT в очереди (еще не реплицированных) по всем реплицированным таблицам.

ReplicasMaxMergesInQueue

Максимальное количество операций слияния в очереди (еще не примененных) по всем реплицированным таблицам.

ReplicasMaxQueueSize

Максимальный размер очереди (в количестве операций, таких как get, merge) по всем реплицированным таблицам.

ReplicasMaxRelativeDelay

Максимальная разница между задержкой реплики и задержкой самой актуальной реплики той же таблицы, по всем реплицированным таблицам.

ReplicasSumInsertsInQueue

Сумма операций INSERT в очереди (еще не реплицированных) по всем реплицированным таблицам.

ReplicasSumMergesInQueue

Сумма операций слияния в очереди (еще не примененных) по всем реплицированным таблицам.

ReplicasSumQueueSize

Сумма размера очереди (в количестве операций, таких как get, merge) по всем реплицированным таблицам.

TCPThreads

Количество потоков в сервере протокола TCP (без TLS).

Temperature_N

Температура соответствующего устройства в ℃. Датчик может возвращать нереалистичное значение. Источник: /sys/class/thermal

Temperature_name

Температура, сообщаемая соответствующим аппаратным монитором и соответствующим датчиком в ℃. Датчик может возвращать нереалистичное значение. Источник: /sys/class/hwmon

TotalBytesOfMergeTreeTables

Общее количество байт (сжатых, включая данные и индексы), хранящихся во всех таблицах семейства MergeTree.

TotalPartsOfMergeTreeTables

Общее количество частей данных во всех таблицах семейства MergeTree. Числа больше 10 000 негативно влияют на время запуска сервера и могут указывать на неразумный выбор ключа раздела.

TotalPrimaryKeyBytesInMemory

Общее количество памяти (в байтах), используемой значениями первичного ключа (учитываются только активные части).

TotalPrimaryKeyBytesInMemoryAllocated

Общее количество памяти (в байтах), зарезервированной для значений первичного ключа (учитываются только активные части).

TotalRowsOfMergeTreeTables

Общее количество строк (записей), хранящихся во всех таблицах семейства MergeTree.

UncompressedCacheBytes

Общий размер несжатого кэша в байтах. Несжато кэш обычно не увеличивает производительность и его стоит избегать.

UncompressedCacheCells

Общее количество записей в несжатом кэше. Каждая запись представляет собой распакованный блок данных. Несжатый кэш обычно не увеличивает производительность и его стоит избегать.

Uptime

Время работы сервера в секундах. Включает время, затраченное на инициализацию сервера перед принятием соединений.

jemalloc.active

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.allocated

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.dirty_purged

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.muzzy_purged

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pactive

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pdirty

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pmuzzy

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.num_runs

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.num_threads

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.run_intervals

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.epoch

Внутренний номер инкрементного обновления статистики jemalloc (аллокатора памяти Джейсона Эванса), используемый во всех других метриках jemalloc.

jemalloc.mapped

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.metadata

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.metadata_thp

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.resident

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.retained

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.prof.active

Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

Смотрите также

  • Monitoring — Основные концепции мониторинга ClickHouse.
  • system.metrics — Содержит моментально вычисляемые метрики.
  • system.events — Содержит ряд произошедших событий.
  • system.metric_log — Содержит историю значений метрик из таблиц system.metrics и system.events.