TiUP 集群新部署启动时,TiKV 节点启动超时无响应

使用TIUP 安装集群,V5.1.1, 已经全部通过TIUP check命令各项参数后 TIUP deploy安装报错,日志:

TIKV 83节点的配置:
image

tikv-20160 service 状态,看到服务是正常有了:

也就是说,监听端口没成功。
怎么回事啊

3 个赞

这两个标签应该要不一样吧:

3 个赞

host改成不一样的试试

3 个赞

不过这指向的是同一个IP地址,同一台机呀

3 个赞

改了节点名之后是没用的 ---- 意料之中
tiup cluster reload tidb-letter

2 个赞

发一下 tikv.log 及 tikv_stderr.log

2 个赞

在同一台机器上部署多个tikv实例,设置不通标签,是为了让副本可以调度到不通的tikv实例上的
labels改完标签后部署deploy也失败了嘛?

2 个赞

是的呢 我贴图了

2 个赞

log的话 已经第一次发帖就贴图了,一样的内容,然后stdeer .log错误日志是没有的。

好的好的,我再发一下附件

2 个赞

topology.yaml:
image

stderr.log里面是没有内容的 没有错误日志输出。

2 个赞

TCP TIME OUT 这个提示 ---- 这个对运维的提示还是有点少,往哪方面去查 再给个提示

2 个赞

1、有个小疑问,这个不是没有改嘛?


2、你这个reload操作是要?

2 个赞

tiup cluster edit-config 去改的,然后改完了 reload;
但是我也注意到 这份原本的它是没改的

1 个赞

请问一下,这个集群正常装好以后,是不是每个节点家目录下都该出现一个.tiup 隐藏文件夹才对?v5.1.1

1 个赞

.tiup目录只会在中控机上有

1 个赞

这个集群应该不是线上环境吧,安装好了,还没能启动
这个你要不铲掉重部吧,,这部署的配置文件里面修改,你这里看好像没有修改成功

2 个赞

感谢回复。还没启动的 。。。铲除吧,又觉得自己怎么没试到这个错误浪费一个场景。
其实那个label那里的写法是直接找的人家部署好的集群仿照的写法,我感觉是没错的

1 个赞

1 个赞

麻烦确认下,你这个服务器有设置网络代理吗?
看起来是 etcd client 发请求超时了

听起来好专业
怎么查看有没设置网络代理 是这个 export http_proxy=http://10.10.xx.251:31xx/ 这种吗
这个是用来开通外网权限的

但这台中控机—用来安装tidb集群所在,tiup命令运行的机台是可以上外网的呢