一个tikv节点的region average written keys指数突然暴增,导致业务卡顿。

【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】v5.4.0 2tidb 3pd 4tikv 2ha
【复现路径】一个tikv节点的region average written keys指数突然暴增,导致业务卡顿,请问下这个问题是什么原因导致的,如何避免。
【遇到的问题:问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件:截图/日志/监控】

在dashboard上查看下这个时间点这个kv的topsql是否有慢查询

看到很多delete语句,执行一个时间达到8.1s左右

大规模删除数据是会越删越慢的,可以优化下

怎么优化?

如果是大量delete 之后,表的健康度可能不够好,
会带来查询计划(CBO)优化偏移,简单说 抽样数据不对,就会影响命中,然后就越来越慢
建议在业务不繁忙的情况,确定 delete 数据被 GC 之后,执行 analyze table ,来重新获取下统计数据,变更下表的健康度。
这种大规模删除数据最好是在业务空闲的时候做。

参考之前的问题答案优化?

1 个赞