使用缩容命令
/home/tidb/tidb-ansible/resources/bin/pd-ctl -u “http://172.16.10.1:2379” store delete 4
使用命令十几天了
/home/tidb4/tidb-ansible/resources/bin/pd-ctl -u “http://172.16.10.1:2379"” store 4
查看状态仍然是Offline
控制台观察,normal stores确实是正常状态,一台已经不再了,但是Offline Stores一直都是1
yilong
(yi888long)
2
您好:
1. 请使用pd-ctl 反馈当前store 和 member 的信息, config show all 反馈当前配置信息,多谢
2. 麻烦反馈inventory.ini中 tikv配置信息
yilong
(yi888long)
4
请问,您反馈的是所有的store信息吗? 当前store只剩一个了? 那他就没法下线了。 你要是不需要了,直接停止集群就好了。
1.确实是4.0rc,不过是用 Ansible 安装的
pd监控信息
tikv.log
tikv.log (99.9 KB)
2.执行gdb -batch -ex “thread apply all bt” -ex “info threads” /xxx/xx/tikv-server tikv-server_pid 报错
Excess command line arguments ignored. (bt” …)
apply: 没有那个文件或目录.
/home/tidb/all: 没有那个文件或目录.
Undefined command: “”. Try “help”.
Undefined command: “”. Try “help”.
yilong
(yi888long)
9
请尝试在中控机安装目录/conf目录的tidb.yml 修改参数值为0,注意对齐。 之后滚动重启tidb和tikv,观察能否下线成功,多谢
ansible-playbook rolling_update.yml -t tidb
ansible-playbook rolling_update.yml -t tikv
tikv.log
tikv.log (187.9 KB)
tidb.log中查看 已经生效
pd-ctl查看region_count数量 对比前面几天,还增加了几十
rleungx
(Ryan Leung)
13
麻烦贴一下 PD 面板里面 scheduler 和 operator 的监控
rleungx
(Ryan Leung)
15
从监控看,PD 的调度器应该没有运行(通过 scheduler is running 的监控以及 *checker 的监控可以看到),还请麻烦提供一下 PD 的 log
rleungx
(Ryan Leung)
20
建议可以重启 PD 试试。rc 版本在 leader 发生重新选举后(从日志上看,应该是盘卡了一下导致 leader 重新选举),如果原 leader 再次成为 leader 就会导致无法调度,下个版本已经修复。
1 个赞
好,目前就一个pd,需要怎么样才可以避免停止服务的情况下重新启动pd,还有下个版本大概什么时候可以发布
@rleungx