TiKV CPU 一直占用很高

为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:
【 TiDB 使用环境】
tidb v5.0.3

【概述】 场景 + 问题概述
目前系统只有600人左右使用,但是 tikv 节点cpu 一直居高不下

【背景】 做过哪些操作

【现象】 业务和数据库现象

【问题】 当前遇到的问题

【业务影响】

【TiDB 版本】

【应用软件及版本】

【附件】 相关日志及配置信息

  • TiUP Cluster Display 信息
  • TiUP CLuster Edit config 信息

监控(https://metricstool.pingcap.com/)

  • TiDB-Overview Grafana监控
  • TiDB Grafana 监控
  • TiKV Grafana 监控
  • PD Grafana 监控
  • 对应模块日志(包含问题前后 1 小时日志)

若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

screencapture-192-168-0-224-3000-d-RDVQiEzZz-tidb-cluster-tikv-details-2022-04-18-16_19_08.pdf (46.3 MB)

[图片]

tikv的log看看吧,另外看下慢查询

top -H -p pid 看看线程的cpu

tikv.log 日志是上边的一直在刷相似内容,tikv_stderr.log 是空的

就是读的多,我看了下你的监控截图,读流量有7G多,你看看tidb的qps,如果不高的话,检查下执行计划,看看有多少不必要的扫描。

慢查询挺多的,锁冲突也挺多,分析下sql吧,是不是没命中索引

image

image

确实是读非常密集,而且看这个热力图是不是存在很严重的热点问题

是挺严重的

好的,明白了。从热力图看是有很严重的热点问题,Top 查询的 SQL 确实有很大部分是没有走索引。 我们先分析优化一部分慢查询 top 的一些查询,再看看结果。 另外想问下,是否有关于锁的手册文档可以协助分析锁的问题。非常感谢!

看你的查询,2k多的qps,大部分延迟在200ms以下,这个水平SQL写的也挺好的了。再优化下热点问题和999的慢查询。

1 个赞

明白了。我先按照官网手册上的热点问题处理,处理一下这个读热点问题,再观察下情况。非常感谢

请问下热点问题处理好了吗?

1 个赞

已经处理好了,根据手册文档打开了缓存,负载就迅速下降了一倍多,非常感谢!

1 个赞

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。