tikv手动stop某一个节点时,客户端连接报错,tikv并没有选举新的tikv服务

下面是我的tikv:

下方是我的客户端连接的报错:

求大佬告知该如何进行解决,是需要怎么配置还是什么?

Raft Group 是怎么配置的

tikv有单独的这个配置嘛?

这个报错本身可能是正常的。TiKV stop 之后,由于 client 上缓存的 region 信息还没有更新,所以第一次连接会失败。

之后的现象是什么,重试也不成功吗?可以再发一下后续的日志,正常情况下 client go 会从 PD 重新获取新的 leader。假如 leader 没有选出来,也应该有相关的其他错误

另外,可以从 PD 上确认新的 leader 是否选出来了。参考 https://docs.pingcap.com/zh/tidb/stable/pd-control#region-region_id---jqquery-string

2 个赞

好的,感谢,我参考一下文档

1 个赞

这个不对啊,我是tikv连不上,不是停止了pd的leader,我是将tikv的leader停止了

我说的 leader 是指 region 的 leader

TiKV 本身并不存在“是否 leader”的说法

pd的leader没有掉,我有三台tikv,但我发现每次调用的tikv都是47.236.143.140这台,然后我将他手动下线后,大概过了好几分钟才换的101.32.10.67,换101.32.10.67区间一直都是报错

是 裸 kv 吗?没有 tidb?

看问题不像是 TiDB 的产品缺陷问题,建议再排查一下 TiKV 和 PD 的网络环境是否有关?比如千兆共享网络带宽打满,导致请求发送排队超时。

你可以提供一下具体的 TiKV 停掉以后,TiKV 里面的 region group 选举报错,是不是因为网络不稳定,导致选举失败导致的。

是的,只有三台pd,五台tikv

info 和warn都是正常告警信息啊,没有error信息

2 个赞

能否提供一下停掉 TiKV 前后一段时间的这个监控:TiKV-Details → Cluster → Leader

此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。