docker部署的tidb,重建pd1容器后报错

【 TiDB 使用环境】测试
【 TiDB 版本】v6.1.2
【复现路径】删除pd1后,重建pd1
【遇到的问题:问题现象及影响】
测试环境部署的tidb,突然无法使用,发现是pd1容器异常挂了,尝试重启pd1容器报错访问etcd2379拒绝,多次无法解决,尝试rm容器后重建:
docker run -d --network bridge --name pd1 -p 2379:2379 -p 2380:2380 -v /etc/localtime:/etc/localtime:ro -v /opt/aspire/ucsp/tidb:/tidb 10.12.7.210:1443/common/pd:latest --data-dir=“/opt/aspire/ucsp/tidb/pd1” --client-urls=“http://0.0.0.0:2379” --advertise-client-urls=“http://0.0.0.0:2379” --peer-urls=“http://0.0.0.0:2380” --advertise-peer-urls=“http://0.0.0.0:2380” --initial-cluster=“pd1=http://10.12.7.210:2380

【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【复制黏贴 ERROR 报错的日志】

【其他附件:截图/日志/监控】

命令写错了 /bin/bash 没有 改成/bin/sh

en 这个问题已经知道了,但是,我的问题不是这个,对与pd容器异常有别的思路吗? :joy:

对于docker或者K8S环境异常的排查思路第一个就是日志,不管是服务日志,还是容器日志,都能提供部分线索。但是很多容器化的时候只会持久数据目录,并没有持久化服务的日志导致容器一重启,日志就没了,所以就失去了排查突然挂了的原因。
第二个,如果日志部分都没看出来,就需要进行debug容器,模拟容器启动的步骤,然后加上断点来辅助判断容器异常的原因。