tidb 集群无法启动

好的,正在试。感谢,我先试试

我已经安装文档的操作了,在没有启动的时候,发现pd上store是空的。但是tikv开启之后,pd的store还有数据。tidb也无法启动还是在找已经下线的ip。

已经下线的ip状态还是offline的,不会变

说下你的操作过程 ,还有tiup display的完整输出

我第一步停止tikv,第二步 关闭pd 调度, 第三步在正常的tikv一个节点,通过下面的命令转移
/opt/tidb-community-server-v5.2.2-linux-amd64/tikv-ctl --data-dir /data1/tidb-data/tikv-20160 unsafe-recover remove-fail-stores -s 15698412 --all-regions ,这里没有看到成功的字眼,

,但是看到有在转移。是不是需要每个tikv都要执行吗?第四步我重启了pd,此时发现store count是空的。第五步启动tikv,这个时候我再发现store有数据

第三步在每个正常的tikv执行

好的,我试下

没启动tikv之前


开启tikv之后就有数据了。我还开启调度呢

这怎么回事啊:innocent:,但是我和上一次做比较,数据量少了一点点

现在什么状态?做了哪些

还是没去掉,执行一次,少几条或者几百条数据

你现在看的store和前面的不一样啊,

一样的store id,因为有很多个,我是通过这个找的,/home/tidb/.tiup/components/ctl/v5.2.2/pd-ctl -u http://172.16.120.124:2379 store check offline |grep id

前面是15698413 后面就成了34673997 ,能贴个tiup display完整输出吗

刚才有做了一遍,但是看到tidb起来了,但是原本正常的tikv有几个没有起来

以前正常的tikv现在起不来,报这样的错误

image 也无法查询

是只处理了这一个store吧,之前有缩容了几个?

不是,处理了很多个。34673997

15698413
15698410

15698412 因为这些都是无效的节点上面的。

现在正常的无法启动,我可以通过缩容,将他们缩掉吗,缩容是不是他们自己的region就会偏移到其他还有的节点上面,还是说,我还要通过刚才的方式,继续偏移

你最初缩容怎么做的? 你看前面链接文章里找下 查找3个副本都没有的 脚本,然后检查下看看有多少全丢失的region,这些得重建里面数据肯定没了