tidb 集群响应时间变长,tikv qps kv_scan指标很高

【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】
【复现路径】做过哪些操作出现的问题

tidb集群突然响应时间变长,单个update执行耗时1s

tikv和tidb的cpu指标都很高,能观察到tikv qps指标内的kv_scan指标很高

【遇到的问题:问题现象及影响】
【资源配置】
【附件:截图/日志/监控】

先试用dashboard分析下慢sql看看

补充下tidb server的响应耗时信息

dashboard有很多bug,当前不太敢用,之前有点过,把tidb server点挂了

那应该是那个版本有问题 后边的版本修复了

这个问题还是要先看dashboard上,哪一步执行耗费时间最长,然后针对某一块的监控去做分析

你这个问问题需要加Tidb的版本啊。

你先升级后截图dashboad说吧。

https://docs.pingcap.com/zh/tidb/stable/upgrade-tidb-using-tiup#使用-tiup-升级-tidb

:joy: :joy: :joy:

那可以改为查看tidb slow log看下

慢日志看过,基本都是之前跑的SQL,基本能排除慢查询的原因;

tidb 节点一直报get timestamp too slow; pd tso 获取明显很慢

解决方案:把所有的tidb server节点重启了下,响应耗时下去了,比较诡异;希望更多大佬补充下原因

万能重启大法,是不是tidb server 的内存耗尽了

就是tidb server cpu负载比较高,没有业务连接的tidb server负载也高,

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。