tidb-service cpu无缘无故飙升99%

【 TiDB 使用环境】生产环境
【 TiDB 版本】6.5.0
【复现路径】无
【遇到的问题:问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件:截图/日志/监控】



goroutine_pd_172.16.215.211_2379_2724836510.txt (92.9 KB)
goroutine_tidb_172.16.215.211_4000_2957135535.txt (99.1 KB)

什么query 都木有,就这么高的 cpu使用率?

看看有查询吗

看下飙升时间点,那台机器在干啥吧

这种单节点内存cpu飙升的大概率是慢查询引起的,可以在dashboard上看下topsql 排查下

看这个时间点延迟有点大,看看是不是io引起的,看看那时间的慢日志,io负载

大概率对应时间点跑了几个大sql,看下topsql吧

查询了没有慢sql,没有业务并发

就tidb-service高 没有别的进程

排查了 没有有问题得sql

tidb 里面 还有好几个模块,可以分别看下,当时的慢日志也看下

重启试试呢,看看能不能降下来,每个tidb server的cpu型号是不是一样,看看

重启可以 不过又会复现 cpu型号都是一样得

都排查了 没有找到有问题得sql

三个节点cpu都高吗。还是就一个节点高

慢查询或者IO_wait吧

是 tidb-server 进程使用的么 :thinking:

这个节点上有部署其他什么东西吗?

你的部署环境是混合部署模式,建议先确定具体是那个组件的CPU使用率过高。
1.检查流量问题
2.慢SQL
3.结合高级调试的手动分析功能。分析具体的CPU持续问题原因。

这种单节点异常,建议直接进topsql页面去看看,这个tidb在运行什么。

https://docs.pingcap.com/zh/tidb/stable/top-sql#tidb-dashboard-top-sql-页面