【TiDB 4.0 PCTA 学习笔记】- 3.7.1 Metrics that DBAs should notice(运维中的关键监控)@2班+董沛霖

课程名称:301 + 3.7.1 Metrics that DBAs should notice(运维中的关键监控)

学习时长:20 min

课程收获:熟悉运维过程中需要关注的性能相关的监控指标

课程内容:

可能导致性能瓶颈的场景

system Info:

CPU Usage > 80%
CPU load >= VCores
IO Util > 80%
TiKV:Memory Usage > 60%
TiDB:Memory Usage > 80%

TiDB 性能相关的重要 Metrics

Duration:OLTP业务下 .99 latency 应小于 100 ms。
Slow query:可以酌情优化SQL。
Ideal CPS:用于判断客户端是否存在延迟,默认是隐藏的,需要通过修改Grafana展现出来,对比实际QPS,若QPS远低于Ideal CPS,则说明客户端存在明显延迟。
Get token duration: 用于判断 token limit 配置是否合理,若 Get token duration > 1 ms,通常说明 token limit 小于实际并发请求量。(每个请求连接 TiDB 的第一件事就是获取 token)。
Parse duration & Compile duration: Parse duration > 10 ms or Compile duration > 30 ms,通常说明 TiDB CPU 处理能力存在瓶颈。

学习过程中遇到的问题或延伸思考:

  • 问题 1:
  • 问题 2:
  • 延伸思考 1:
  • 延伸思考 2:

学习过程中参考的其他资料