TIKV 报错:cdc initialize fail

【TiDB 使用环境】生产环境
【TiDB 版本】v7.5.6
【操作系统】centos7
【部署方式】



【遇到的问题:问题现象及影响】
连接数不够,leader发生切换,慢查询增多


【复制黏贴 ERROR 报错的日志】

【其他附件:截图/日志/监控】

看日志底层是是 stale command 和 peer is not leader for region错误

看下overview-> tikv ->leader监控

可以试试先临时关闭 PD 非必要调度,稳定 leader

然后再试一下扩容 TiDB 连接数,解决连接瓶颈

增加 TiDB 连接数试试呗

找不到leader?

1 个赞

连接数设的多少

1 个赞

增加一下再试

2 个赞

感觉得看下0.140为什么会掉leader。如果是网络抖动,可以试试调大raft-election-timeout-ticks。重新选主间隔时间的计算是:raft-election-timeout = raft-base-tick-interval * raft-election-timeout-ticks。其中 raft-base-tick-interval默认值是1秒。

1 个赞

BR备份的过程中,是否会导致leader切换?br备份过程中会从各个tikv节点备份region数据,这个过程可能会导致leader切换?

1 个赞

连接数是程序控制的吧?

1 个赞

如果增加会不会带来其他问题呢?

1 个赞

该报错多因TiKV节点leader频繁切换、请求过期,需先优化连接数,再调整PD调度策略稳定leader。

1 个赞

试试先临时关闭 PD 非必要调度,稳定 leader

找不到leader了?

这样做有什么坏处呢?

大佬,您搞定了吗

连接数一下增加这么多是因为CDC失败导致的?

资源过载把. 先调大连接数限制,暂停备份任务,让集群喘口气。