有人遇到过某个 TiKV 的 coprocessor 持续过高,而其他 kv 节点正常的场景吗?

为提高效率,提问时请尽量提供详细背景信息,问题描述清晰可优先响应。以下信息点请尽量提供:

  • 系统版本 & kernel 版本:
  • TiDB 版本:
  • 磁盘型号:
  • 集群节点分布:
  • 数据量 & region 数量 & 副本数:
  • 集群 QPS、.999-Duration、读写比例:
  • 问题描述(我做了什么):

大家有没有遇到过,某个 TiKV 的 coprocessor 持续过高,而其他 kv 节点正常的场景?是因为数据倾斜么?

建议看下监控 PD 中是否有 hot region 的相关信息

Hot Region 并不明显,而且是某个固定的 TiKV 节点长时间 coprocessor-normal 高负载

下次如果再发生这种问题

  1. 请检查监控中 Thread CPU - Coprocessor CPU ,查看是哪台 TiKV 的压力比较高
  2. 去几个 TiDB 中 show processlist 中查看有没有运行时间长的大查询(或在日志中查找 slow query 、 expensive query 等),结合日志中的 (store_addr) 查看能否与上一步找到的 TiKV 一致。 优化这个 SQL ,如果有热点请尝试打散。
1赞

看着是某些 SQL 导致的 slow / expensive query 引发的高负载。 具体的我来优化下再观察看看。