为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:
【TiDB 版本】
v.4.0.0
【问题描述】
tidb 连不上pd,pd启动的,pd 连不上tidb
pd 日志:
tidb 日志
若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。
tikv 日志
为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:
【TiDB 版本】
v.4.0.0
【问题描述】
tidb 连不上pd,pd启动的,pd 连不上tidb
pd 日志:
tidb 日志
若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。
tikv 日志
目前都没有启动,先启动,看看 pd 能否启动,如果不行,看下 pd 报什么错。
不好意思,上面的图片我传的是测试环境,最开始那个图片我传的是华为云的环境,这两个环境报的错都是一样的。
测试环境还有很多初始化数据在里面,需要导出来,导出后考虑重装。
本地环境 run_tikv.sh 脚本内容如下,
systemd 目录下启动文件是指哪一个?
我看到pd,或者tidb
tiup cluster start <集群名称>
tiup-cluster-debug-2021-05-26-15-19-18.log (831.1 KB) tikv_stderr.log (126 字节) tikv.log (1.9 MB) pd.log (15.2 KB)
就是不断的启停.反正起不起来就停止然后又重启,返回的这样操作了好多次,你这个是pd的日志,这是本机的日志,用的是127.0.0.1 应该可以吧,没有修改过配置文件。
开始数据库服务器是好好,后面不知道怎么的数据库喜欢挂,最开始挂了启动还是很快的,后面慢慢的就启动不起来了。
提供一下 pd 部署目录下的 run_pd.sh 脚本内容
你脚本中的内容和日志显示的 IP 是有问题的,我建议你3个pd 都依次检查一下这个:
1、查看 /etc/systemd/systemd 对应 pd 端口的 service 文件内容中 脚本的目录 是否和 部署目录一致
2、查看部署目录下的 run_pd.sh 是否正常(ip、port 是否正确)
3、关闭 3 台 pd 服务器上的 pd 进程(关闭后要验证,因为 15s 之内,可能会被拉起)
4、再 tiup cluster start ClusterName -R pd 单独 启动 pd
5、查看 其中 一个 pd 的日志,查看对应的日志里的 启动时所用的 ip 和 run_pd.sh 中的是否一样,查看 pd 是否报错,如果不报错,再启动 tikv 、tidb
/etc/systemd/systemd 目录下 pd-2379.service 内容如下,目录地址是正确的,
运行 tiup cluster stop test-cluster 命令
pd 已经全部停止了:查询端口没有被占用了
启动pd
192.168.31.8 pd.log 日志
上传中:pd_stderr.log… pd.log (13.7 KB) node_exporter.log (3.6 KB) blackbox_exporter.log (382 字节)
192.168.31.8查看端口,实际是启动了
192.168.31.9 pd.log 日志
blackbox_exporter.log (385 字节) node_exporter.log (3.6 KB) pd.log (27.6 KB) 上传中:pd_stderr.log(1)…
192.168.31.8查看端口,实际是启动了
1、你这是什么集群,如果是 测试环境,能 reload 一下集群嘛,你的脚本内容看着好像有点问题