tiup 起集群 tidb 报超时

tiup 版本:

报错:




您好:

    1. 从截图看,当前有一个4000端口的进程? 能否尝试先关闭这个tidb,保证没有进程,再尝试启动?
     2. 如果关闭后,进程还在可以尝试kill这个进程。

这个4000 是tiup起集群的时候起的,但是查端口查不到

您好: 现在不是在启动的时候,报错tidb无法启动吗? 尝试关闭集群种的这个tidb实例,确认不存在这个进程,再次启动尝试,多谢。

tiup cluster stop cn_tidb 执行这条会成功
image

tiup cluster start cn_tidb

卡在这里报超时

  1. 在您stop成功以后,在102这个ip地址使用ps -ef | grep tidb-server命令还能查到tidb-server进程吗?
  2. 在确保无tidb-server进程后,再启动
  3. 请长传102上的tidb.log日志
  4. 请检查tiup中控机和102之间无防火墙,或者已经放通端口。 请确保102防火墙已经关闭

1、停掉集群


2、


3、tidb.log 报错

4、中控和tidb是同一台机器

tiup 关闭集群了

systemctl status tidb-4000.service
这个还是运行的查端口查不到

你好,

为了让集群正常集群

  1. 上传下完整的 tidb.log 文件和集群拓扑文件,检查下是否有不识别的参数和yaml 格式问题
  2. 如果 tidb-4000 仍在运行,可以尝试手动 kill 下。我这边会反馈

配置文件

[tidb@b6 ~]$ cat .topology.yaml global: user: “tidb” ssh_port: 22 deploy_dir: “/home/tidb/tidb-deploy” data_dir: “/home/tidb/tidb-data”

monitored: node_exporter_port: 9100 blackbox_exporter_port: 9115

server_configs: tidb: log.slow-threshold: 300 binlog.enable: false binlog.ignore-error: false tikv: readpool.storage.use-unified-pool: true readpool.coprocessor.use-unified-pool: true pd: schedule.leader-schedule-limit: 4 schedule.region-schedule-limit: 2048 schedule.replica-schedule-limit: 64 replication.enable-placement-rules: true tiflash: logger.level: “info”

pd_servers:

  • host: 192.168.10.101
  • host: 192.168.10.102

tidb_servers:

  • host: 192.168.10.102

tikv_servers:

  • host: 192.168.10.103 data_dir: “/disk1/tidb-data”
  • host: 192.168.10.104 data_dir: “/disk1/tidb-data”
  • host: 192.168.10.105 data_dir: “/disk1/tidb-data”

tiflash_servers:

  • host: 192.168.10.102

monitoring_servers:

  • host: 192.168.10.102

grafana_servers:

  • host: 192.168.10.102

alertmanager_servers:

  • host: 192.168.10.102

手动停掉在起还是报错

tiup启动失败,手动查看进程状态还是有的,查端口没有

你好,

这些都是问题的表象,请看下我的回复

提供下 tidb.log 文件,检查下拓扑文件中是否存在格式和参数不正确问题,也可以上传上来,我们看下。

tidb.log (32.2 KB)

拓扑文件这个是啥文件

你好,

请检查,tidb 服务器和 tikv 服务器网络是否正常,从日志看 tidb 对 tikv rpc 请求超时,

拓扑文件为 deploy 指定的 yaml 文件,此为最初的架构文件

配置文件
topology.yaml (1.1 KB)

这面是tidb 4000进程端口起不来,手动用sudo systemctl status tidb-4000 起来了但是端口查不到,另外在配置文件又加了一台tidb节点也是同样的报错

你好。

扩容 tidb 请参考tiup 扩容 tidb

  1. 检查 tidb 服务器和 tikv 服务器间网络是否正常
  2. 如果为了测试 tidb 4.0-rc 可以尝试重新部署 tidb 集群(tiup cluster destroy cn_tidb;tiup cluster deploy cn_tidb v4.0.0-rc ./.topology.yaml)

网络正常,不是测试准备线上用,已经重新部署好几遍了都是一样的错误

从 tidb 的日志来看,是因为连不上 tikv (随便找了一个 store 地址 192.168.10.105),请确认在是否可以在 tidb 节点 (192.168.10.102) 上能访问 192.168.10.105,可能是因为防火墙之类的导致节点之间网络不互通。

1 个赞