tikv 缩小节点,balance 不动

(1)tidb 4.0 16个tikv 节点,踢出8个tikv 节点,目前看,没有做move操作,应该从哪些地方排查

今天看没有做move 操作,貌似hang 住了,我重启pd和tidb 节点,也没有用

你说的 move 操作是指什么?

image move 是这个里面显示的迁移操作

感觉hang 住,是因为这个leader 没有变动

您好:

    1. 请问还有执行缩容操作时的命令吗?

    2. 请执行pd-ctl命令 store ,反馈当前的store信息,member信息

    3. 麻烦上传一个pd日志和tikv日志,pd上传leader日志(第二步member可以看到leader节点),tikv上传一个缩容的节点,和一个正常节点,多谢

缩容操作命令
image

当前的store信息,member信息
111.txt (18.8 KB)

pd 1.3 leader节点的日志

tikv 缩容节点日志

存在正常tikv节点日志

查看pd日志有重启,请把重启顺序和哪些都重启了,写明下,多谢

我先手工重启了pd节点,轮流重启, 查看leader节点没有做迁移操作 然后重启tidb节点 轮流重启 查看leader节点没有做迁移操作

最后轮流重启,现在没有踢出的tikv 节点

您好:
1. region 9952780 看看信息

2 拿下每个 peer 的 log,用这个命令可以查到9952780对应的peer所在节点
https://pingcap.com/docs-cn/v3.0/reference/sql/statements/show-table-regions/#show-table-regions

10246798tikv.txt (4.7 MB)

tikv11.rar (1.0 MB)

这个11 是store 14节点的日志

tikv1.rar (145.1 KB)
这个是store 1的日志

gdb -batch -ex “thread apply all bt” -ex “info threads” binary 21734 &> /tmp/log

log_tikv_store14.txt (377.4 KB)

尝试重启store 1后开始下线,请继续观察

  1. 查看filter target,尝试重启对应store