tikv节点cpu不均衡

路在何chu · 2024 年2 月 6 日 06:32

【 TiDB 使用环境】生产环境
4013
【复现路径】做过哪些操作出现的问题
其中一个节点的cpu比其三个节点cpu高
【遇到的问题：问题现象及影响】

继续排查发现是.unified-readpool-cpu这一个高

路在何chu · 2024 年2 月 6 日 06:33

而且那个cpu高的节点的running task比其他三个节点高

路在何chu · 2024 年2 月 6 日 06:34

已经排查四个节点的cpu型号，核数，内存。磁盘类型都是一样的

路在何chu · 2024 年2 月 6 日 06:40

而且这四个节点的leader数量和region数量几乎一样

dba远航 · 2024 年2 月 6 日 06:43

是不是相关业务查询的数据的leader正好在这个高的节点呢？

路在何chu · 2024 年2 月 6 日 06:44

那不可能一直在这个节点啊，leader也会转移吧，我怀疑的那个running task导致的，但是那个task都有哪些，咋查啊

小龙虾爱大龙虾 · 2024 年2 月 6 日 06:48

优化下慢SQL吧

tidb菜鸟一只 · 2024 年2 月 6 日 06:51

unified-readpool-cpu这个就是你查的数据量大了，消耗的cpu就多，你看下leader和region在tikv上的分布情况呢？是不是cpu高的这个leader要多一点

路在何chu · 2024 年2 月 6 日 06:52

整体cpu都不高，也没有啥特定时间的慢sql,慢sql都优化完了

路在何chu · 2024 年2 月 6 日 06:54

几乎一样

tidb菜鸟一只 · 2024 年2 月 6 日 07:01

热点有吗，对应热点表看下region的leader是不是都在这台高cpu节点上

路在何chu · 2024 年2 月 6 日 07:08

读热点很高，我查一下那些热点表在每个节点的数量统计一下看看

路在何chu · 2024 年2 月 6 日 07:47

查了一下这两个热点表确实leader最多

路在何chu · 2024 年2 月 6 日 07:48

144这个tikv确实热点leader比较多，那这个咋移动啊，我们人为可以干预吗

tidb菜鸟一只 · 2024 年2 月 6 日 07:52

路在何chu · 2024 年2 月 6 日 08:00

这些表已经打散了，我们的主键id都是随机生成的字符串，不是自增的

tidb菜鸟一只 · 2024 年2 月 6 日 09:15

operator add transfer-leader 2 5：将 Region 2 的 Leader 迁移至 Store 5
是可以通过pdctl手工移动的，但是这也太麻烦了，正常random的话，应该基本就是平均分的吧。。。。

TiDBer_5Vo9nD1u · 2024 年2 月 6 日 12:47

每个主机的配置一样吗？

路在何chu · 2024 年2 月 7 日 06:28

应该是正好这个热点表的region在那个114节点多，我查了其他的表，每个实例上的对应表的region都是有多有少，这个概率问题

路在何chu · 2024 年2 月 7 日 06:29

配置肯定都是一样的