集群升级到4.0.4之后,TiFlash无法启动

首次安装了tidb4.0.0版本,新增了tiflash实例后,tiflash启动成功,但是tikv的数据无法同步。之后升级到4.0.4版本,集群启动后显示成功。但是查询集群状态,tiflash实例没有启动成功。

建议升级到 v4.0.6 使用

  1. scale-in --force -N 10.1.94.104:9090 ,先缩容 tiflash 节点。
  2. tiup cluster upgrade tidb-test v4.0.6,升级 tidb 集群
  3. scale-out scale-out_tiflash.yaml,扩容 tiflash 节点
  4. start -R tiflash,看下结果

十分感谢您的回复,和您确认下,缩容tiflash节点的命令‘scale-in --force -N 10.1.94.104:9090’,是9000端口还是9090?我看文档上是9000?

看串行了,9000,这个 -N 指的是 display 结果中的 ID

存在几个问题:
1.使用缩容命令,缩容了tiflash后,缩容成功后不会删除tiflash的部署目录等,需要再次使用display命令验证一次集群后,才会触发删除目录等动作,不知道这个是不是设计的时候就是这样思考的。
2.升级到4.0.6后,出现这样的显示,一直在等待,不知道是不是正常现象?

将集群升级到了v4.0.6


扩容了tiflash节点,启动tiflash节点后显示success,但是查询集群实例列表发现并没有启动

dashboard上也没有tiflash实例信息

查看了tiflash_error日志, 看到有错误输出,是由于本机9000端口被占用(9000端口被服务器上别的应用正在使用中了),那请问是否可以修改tiflash 的这个端口?

edit-config 删除 tiflash 相关的信息,scale-out 重新扩容。再启动看下

是9000端口占用的问题,我现在在tiflash节点下deploy目录下修改了conf文件,tcp_port从9000改为9001,



再起启动tiflash成功了

但是虽然我修改了9000端口为9001启动成功,不过这里列出实例状态的时候还是显示9000。这个可以再哪里更改?

启动后现在使用tikv同步到tiflash也已经可以使用了,


查询也走了tiflash

感谢您的解答,不过现在就是查询状态列表那边显示tiflash还是用的9000端口,实际上我启动的时候已经改成了9001端口,这个display列表里面的要怎么修改?它这个查询状态没有查询我当前启动的实例状态吗?我怎么样可以修改它?

edit-config 去修改这个端口。

节点下的配置文件会被刷新的。

v4.0.6 版本对修了一些 tiflash 的 bug,虽然和之前的启动问题没有必然联系,但是使用最新版本的集群可以避免一些问题,

之前 display 结果中 tiflash 节点状态为 Tombstone,所以当时建议重新扩容。

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。