Skip to content

Latest commit

 

History

History
120 lines (71 loc) · 3.35 KB

monitor.md

File metadata and controls

120 lines (71 loc) · 3.35 KB
title category
TiDB-Lightning 监控告警
tools

TiDB-Lightning 监控告警

TiDB-Lightning 支持给 Prometheus 采集监控指标 (metrics)。本文主要介绍 TiDB-Lightning 的监控配置与监控指标。

监控配置

  • 如果是使用 TiDB-Ansible 部署 Lightning,只要将服务器地址加到 inventory.ini 里的 [monitored_servers] 部分即可。
  • 如果是手动部署 Lightning,则参照以下步骤进行配置。

tikv-importer

tikv-importer v2.1 使用 Pushgateway 来推送监控指标。需要配置 tikv-importer.toml 来连接 Pushgateway:

[metric]

# 给 Prometheus 客户端的推送任务名称。
job = "tikv-importer"

# 给 Prometheus 客户端的推送间隔。
interval = "15s"

# Prometheus Pushgateway 地址。
address = ""

tidb-lightning

只要 Prometheus 能发现 tidb-lightning 的监控地址,就能收集监控指标。

监控的端口可在 tidb-lightning.toml 中配置:

[lightning]
# 用于调试和 Prometheus 监控的 HTTP 端口。输入 0 关闭。
pprof-port = 10089

...

要让 Prometheus 发现 Lightning,可以将地址直接写入其配置文件,例如:

...
scrape_configs:
  - job_name: 'tidb-lightning'
    static_configs:
      - targets: ['192.168.20.10:10089']

监控指标

本节详细描述 tikv-importertidb-lightning 的监控指标。

tikv-importer

tikv-importer 的监控指标皆以 tikv_import_* 为前缀。

  • tikv_import_rpc_duration(直方图)

    导入 RPC 需时的直方图。标签:

    • request:RPC 名称,如 open_engineimport_engine
    • resultok / error
  • tikv_import_write_chunk_bytes(直方图)

    tidb-lightning 写入每个区块大小的直方图。

  • tikv_import_write_chunk_duration(直方图)

    tidb-lightning 写入每个区块需时直方图。

  • tikv_import_upload_chunk_bytes(直方图)

    上传到 TiKV 的每个区块大小的直方图。

  • tikv_import_upload_chunk_duration(直方图)

    上传到 TiKV 的每个区块需时的直方图。

tidb-lightning

tidb-lightning 的监控指标皆以 lightning_* 为前缀。

  • lightning_importer_engine(计数器)

    计算已开启及关闭的引擎文档数量。标签:

    • typeopen / closed
  • lightning_idle_workers(测量仪)

    计算闲置的工作流程。数值应低于 table-concurrency/region-concurrency,而经常为零。标签:

    • nametable / region
  • lightning_kv_encoder(计数器)

    计算已开启及关闭的 KV 编码器。KV 编码器是运行于内存的 TiDB 实例,用于将 SQL 的 INSERT 语句转换成 KV 对。此度量的净值(开启减掉关闭)在正常情况下不应持续增长。标签:

    • typeopen / closed
  • lightning_tables(计数器)

    计算处理过的表及其状态。标签:

    • statepending / written / closed / imported / altered_auto_inc / checksum / completed
    • resultsuccess / failure
  • lightning_chunks(计数器)

    计算处理过的 Chunks 及其状态。标签:

    • stateestimated / pending / running / finished / failed