集群突然响应变慢

【 TiDB 使用环境】生产环境
【 TiDB 版本】v4.0.16
【遇到的问题:问题现象及影响】
23日下午19点,突然反馈系统变慢。Point_Get都需要好几秒。
检查服务器资源情况,IO、内存、CPU正常,但是Duration明显升高,网络流量也打满了。
检查热点流量图,没有热点。GC时间是10min。
检查慢语句也没有明显的慢语句,只发现有上锁耗时比较大。
这种情况应该如何分析?
【资源配置】
三节点混布,千兆带宽,机械硬盘,超融合
【附件:截图/日志/监控】




就是事务变慢了,上锁慢嘛

我感觉是资源竞争,有等待的情况…

参考之前的帖子好了
https://asktug.com/t/topic/452792

for update 语句新上的吗?现在居然还有人用for update啊,我以为这种很少很少了。

资源争用么?看内存CPUIO这些都还正常,哪个图表可以进一步确认?

不是, 同一个数据,被多个请求同时处理,其中只有一个能拿到锁,其他的都在等待状态

等哪个持有锁的完成了操作之后,才能获取到锁…

这个期间就会有等待的时长

好像有那么种可能

这次还是只有6个小时的历史记录,又没有拿到相应信息

多并发频繁更新?

并发度应该没那么高。