tidb链接很慢

【 TiDB 使用环境】生产环境
【 TiDB 版本】v6.5.1
【复现路径】
【遇到的问题:问题现象及影响】
tidb oom了之后突然开始连接变慢,使用mysql -u -p 等好久才能进去,但是在里面实际执行sql又是正常的。
各个节点均没有压力
【资源配置】
【附件:截图/日志/监控】

遇到过同样的情况,当时看日志也是正常的,后来重启集群后解决

1 个赞

我这边是滚动升级到7.5.1解决的

重启试试

是不是Connection太多了?

看看个个日志有没有异常

日志有没有报错,有没有阻塞的SQL

看你截图里面的query平均耗时在14:10到15:10之间还挺高的,看下这段时间Dashboard的慢SQL和Grafana Overview页面TiDB页签下的各个节点的连接数情况。

几点出的问题,看监控是变慢了啊

dashboard和grafana那时候根本打不开,因为他们也需要链接tidb。等恢复了我再看慢查询,更多是系统库表的慢查询,业务的慢查基本没有

14:11就出问题了

应该不是,因为升级之前我滚动重启过tidb节点,重启之后也不行,链接还是很慢,而且链接太多应该会有那个too many connections 的报错,我这边没有

如果重启就好了,是不是残留了太多的阻塞会话信息

只重启tidb还不行,重启完还是慢

异常对应时间的错误日志



操作系统的资源情况呢,比如openfiles等

1、从监控上看,SQL 有明显执行变慢的情况,最慢达到分钟级,建议找几个慢 SQL 看下
2、日志看有网络相关的报错,建议看下监控的 blackbox-expoter 下的 ping 延迟监控

慢sql没有问题,后来通过dashboard看过了。执行sql实际不慢的,后来从dashboard里面也拉不到分钟级的sql。只是grafana显示成这样。 blackbox-expoter 下的 ping 这块是空的,但是机器上还有别的tidb,那些没问题的。

我不觉得 grafana 会出现显示错误,这个指标后台数据类型应该是直方图,显示成这样就证明确实有慢 SQL,你再查查,把你查的截图放上来

为什么会是空的呢?是一直是空的,还是就问题时间段是空的

一直是空的,grafana文件是我自定义的,这部分应该是漏掉了