【TiDB 使用环境】生产环境 /测试/ Poc
【TiDB 版本】v8.5.2
【操作系统】Rocky10
【部署方式】虚拟机部署 12c 16g x N
【集群数据量】该问题无关数据量
【集群节点数】3kv 3db 2pd 该问题无关节点数,任意节点皆可复现
【问题复现路径】
1.准备一个可以正常运行的tidb 集群,任何配置都可以,跟配置无关
2.使用 tiup cluster edit-config 编辑配置文件
3.增加如下配置
server_configs:
tidb:
log:
file:
max-size: 100MiB
max-days: 3
max-backups: 5
增加后保存,tiup没有拒绝该配置。可以保存。
4.重复使用tiup cluster edit-config 编辑配置文件,可见tiup已经修改参数为
server_configs:
tidb:
log:
file: "max-size: 100MiB max-days: 3 max-backups: 5"
我理解这里就是参数是没问题的。
5.使用tiup cluster reload 重新部署集群,使用 -R指定角色或不指定角色均可,不影响结果。
6.tiup把配置推出去后,在pd/db/kv的第一个节点上就会卡住,访问节点主机可以看到节点已经关闭了,但是tiup没反应。ctrl+c终止tiup后,使用 tiup cluster display 查看集群状态,可以看到 pd / kv / db 都离线了。
7.使用 tiup cluster start/restart/reload 均无法重启结点,tiup都是卡住。
8.重启节点主机,节点也不会正常启动。
9.查询有问题节点的日志。无任何新日志产生。可以理解为节点上的服务就没启动。
10.重新使用 tiup cluster edit-config 编辑配置文件,删除相关配置。reload后也无法启动节点。
至此该集群彻底死去失去响应。除了虚拟机回滚,没有找到救回的办法。
【遇到的问题:问题现象及影响】
错误配置会导致所有pd/db/kv节点无法启动且无日志。
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【复制黏贴 ERROR 报错的日志】
【其他附件:截图/日志/监控】
该问题不产生日志,但是问题可复现。