【TiDB 使用环境】生产环境
【TiDB 版本】v7.5.6
【操作系统】centos7
【部署方式】
【遇到的问题:问题现象及影响】
连接数不够,leader发生切换,慢查询增多
【复制黏贴 ERROR 报错的日志】
【其他附件:截图/日志/监控】
【TiDB 使用环境】生产环境
【TiDB 版本】v7.5.6
【操作系统】centos7
【部署方式】
【遇到的问题:问题现象及影响】
连接数不够,leader发生切换,慢查询增多
【复制黏贴 ERROR 报错的日志】
【其他附件:截图/日志/监控】
看日志底层是是 stale command 和 peer is not leader for region错误
看下overview-> tikv ->leader监控
可以试试先临时关闭 PD 非必要调度,稳定 leader
然后再试一下扩容 TiDB 连接数,解决连接瓶颈
增加 TiDB 连接数试试呗
找不到leader?
连接数设的多少
增加一下再试
感觉得看下0.140为什么会掉leader。如果是网络抖动,可以试试调大raft-election-timeout-ticks。重新选主间隔时间的计算是:raft-election-timeout = raft-base-tick-interval * raft-election-timeout-ticks。其中 raft-base-tick-interval默认值是1秒。
BR备份的过程中,是否会导致leader切换?br备份过程中会从各个tikv节点备份region数据,这个过程可能会导致leader切换?
连接数是程序控制的吧?
如果增加会不会带来其他问题呢?
该报错多因TiKV节点leader频繁切换、请求过期,需先优化连接数,再调整PD调度策略稳定leader。
试试先临时关闭 PD 非必要调度,稳定 leader
找不到leader了?
这样做有什么坏处呢?
大佬,您搞定了吗
连接数一下增加这么多是因为CDC失败导致的?
资源过载把. 先调大连接数限制,暂停备份任务,让集群喘口气。