TiDB升级到6.5.2后,CPU出现100%情况,服务在重启,服务器无法处理,一会就卡死了,请大神帮帮忙

【 TiDB 使用环境】生产环境
【 TiDB 版本】
6.5.2版本
【复现路径】从5.4.2升级到6.5.2
【遇到的问题:问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面

【附件:截图/日志/监控】


231是安装 tiup的服务器。一直down状态

请检查一下tiup 的日志以及每个节点的启动日志

现在使用tiup重启命令都不行,一会就卡死了。日志都没法看。我先给自动启动给停了。再看看日志

是升级引发的吗

应该是新版本的tiflash问题,一直重启,系统卡的死死的,进去修改参数都改不了


这是pd的启动日志。能看出是什么问题嘛,现在服务器能启动了,但pd节点都失败了

数据不一致…

大神,数据不一致要怎么处理?

麻烦咯

  1. 元数据是否一致
  2. 内容数据是否一致
  3. 那些tikv 实例不一致

要根据情况来判断那些是好的,那些是坏的,坏的就要强制下线
如果你有数据备份,建议你重装后,恢复数据算了…

现在tikv节点都启动不了。数据备份不是新的,数据量也比较大,看看能不能只启动一个节点,把数据 备份出来 再重装了

这个后面是怎么解决的呢

打包重装吧。