K8S在IPv4环境下部署失败,pd容器一直不断重启

单机部署,你说的网络是哪个,K8S的网络?还是DNS?

进不了debug模式,直接重启了。 这就是让人烦的地方。

E0717 06:18:02.596771 1 pd_member_manager.go:195] failed to sync TidbCluster: [ns/basic]'s status, error: Error response 503 URL http://basic-pd.ns:2379/pd/api/v1/health,body response: no leader
, service ns/basic-pd has no endpoints

这表明 PD 集群的 Pod 可能已经启动,但是还没有选出 leader。难道是 pd oom 或者什么问题导致 pd leader 消失了 :thinking:

确认是这个引起的吗?

可以排查一下网络问题。

多谢指导,但是现在我为了验证问题,跑的是单机;仍然有网络问题? 那要么是dns、要么是K8S和docker那一套网络问题

网络问题?

即使有网络问题,也不好排查;地址是动态的,使用虚拟网络,抓包有点困难
并且目前不能判断是pd自己退出,还是k8s把它干掉,还是ti-operator把它干掉。
看起来像pd自己退出。