三个tikv节点，分批cpu飙高

大钢镚13146 · 2025 年1 月 10 日 03:29

【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】 7.5.1
【复现路径】做过哪些操作出现的问题
【遇到的问题：问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件：截图/日志/监控】
有一个tidb集群，应该是存在热点读的情况，三个tikv节点cpu依次的高

主要的批量查询语句是对于热点表的主键排序后的 limit 10000的操作，都是连续的往后查询一直查完所有的
怀疑是连续的 limit 10000的操作打到了相同的tikv节点，导致分批的的tikv cpu 高
看这个表的leader region 也是差不多的

后面应该怎么排查，请给与思路

有猫万事足 · 2025 年1 月 10 日 04:15

连续一小时一直对着一个表limit 10000？
如果连续扫到的都是这一段数据的话，那不就是说着这1小时内，这一段数据其实也没有大的变化。
最好是考虑把最新的10000w条放redis里面去

大钢镚13146 · 2025 年1 月 10 日 05:48

相当于对表的一大部分做扫描只不过是按照主键进行排序每次取 10000 处理一直扫完

小龙虾爱大龙虾 · 2025 年1 月 10 日 05:50

cpu 高就看 dashboard 上的 top sql

有猫万事足 · 2025 年1 月 10 日 05:50

就是分页查，每次取10000行，这样？
那这部分查出去，后续是做了什么？如果是后续还需要聚合，可以考虑别查出去了，直接在tiflash上算。

读热点，现在除了副本读也没有太好的解决方法。

https://docs.pingcap.com/zh/tidb/stable/troubleshoot-hot-spot-issues#打散读热点

大钢镚13146 · 2025 年1 月 10 日 06:39

top sql就是我上面发的那个对主键批量的进行 limit 10000 循环取

大钢镚13146 · 2025 年1 月 10 日 06:44

走联合索引 order by 主键 limit 10000 走tiflash 应该不好用吧

有猫万事足 · 2025 年1 月 10 日 06:45

不好用，但是后续如果查出去还需要再聚合一次的话，这个聚合可以用tiflash，没聚合就算了。不要这么折腾了。

大钢镚13146 · 2025 年1 月 10 日 06:57

感觉可以切割下region 或者给整个表的region再重新打散一下

有猫万事足 · 2025 年1 月 10 日 11:22

https://docs.pingcap.com/zh/tidb/stable/sql-statement-split-region#split-table-region

那你看看这个，这种切分region的做法对写入的提升还是挺明显的，读取我感觉效果不是非常明显。

Kongdom · 2025 年1 月 11 日 06:37

dashboard的热力图看了么？
https://docs.pingcap.com/zh/tidb/stable/dashboard-key-visualizer#常见热力图解读

kang · 2025 年1 月 11 日 11:40

看热力图就行了看看是不是有热点表

koby · 2025 年1 月 11 日 13:20

看慢SQL吧

cchouqiang · 2025 年1 月 12 日 03:39

tikv的cpu使用率不同，应该是有热点了