【 TiDB 使用环境】生产环境
【 TiDB 版本】v5.4.3
【遇到的问题:问题现象及影响】pd leader 每天不定时cpu高负载
【资源配置】48核、256G、(3T nvme) * 2
数据冷存节点,平时基本没有任何访问量,每次监控上的高负载,已经确定都是pd导致。
pd.log (790.0 KB)
【 TiDB 使用环境】生产环境
【 TiDB 版本】v5.4.3
【遇到的问题:问题现象及影响】pd leader 每天不定时cpu高负载
【资源配置】48核、256G、(3T nvme) * 2
数据冷存节点,平时基本没有任何访问量,每次监控上的高负载,已经确定都是pd导致。
pd.log (790.0 KB)
看下pd页面的监控
从日志看,基本都是写热点region调度。是不是某个表写热点比较严重,导致pd频繁调度。
[operator=""move-hot-write-peer {mv peer: store [15] to [274433474]}
可以查看 PD 的监控,看看 region 和 leader 的变化是否和 CPU 使用匹配。是否在 CPU 高峰期,有很多的调度。可能是热点导致,或者增加节点,删除节点等。
10.1.3.121 这个节点又没有混合部署其他应用?每隔12小时有没有定时任务?
对应时间段的监控贴上来,还有日志
你这个节点是不是混合部署了 pd tikv tiflash ,还有其他吗
是的,但是导致负载高的的确是pd
目前尝试过关停疑似高写入的服务,关停auto analyze,结果问题依旧
求助,顶贴