tidb operator 配置tidb-cluster的健康检测

为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:
【 TiDB 使用环境】
通过tidb-operator部署的tidb集群

【概述】:场景 + 问题概述
系统在某段时间负载高,负载降低后,pd和tidb之间的连接不能自动恢复,想通过tidb-operator配置健康检测,对于不正常的组件重启
【背景】:做过哪些操作

【现象】:业务和数据库现象
tidb连接不上pd,并且不再重试了
【问题】:当前遇到的问题

【业务影响】:
数据库所在节点某段时间负载高,不能自恢复
【TiDB 版本】:
4.0.8
【TiDB Operator 版本】:
1.1
【K8s 版本】:
1.14
【附件】:


若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

1 个赞

或者通过tidb-operator创建的tidb的statefulset可以定制一些配置,比如kubernets的Liveness,Readiness

我给你挪到需求区了 :+1:

此需求的来源 :

请需求区的小伙伴继续跟进… :nerd_face:

1 个赞

:+1:

tidb 连接不上 pd 有什么报错么,后面是通过重启 tidb 还是 pd 就解决了?如果配置健康检测,是希望检测哪些状态呢,比如端口不通?

重启tidb解决了,通过ping和telnet发现端口是通的,但是连接数据库会卡到连接那一步

还有具体报错日志么

log.zip (5.1 MB)
这个

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。