TiKV启动失败

为提高效率,提问时请尽量提供详细背景信息,问题描述清晰可优先响应。以下信息点请尽量提供:

  • 系统版本 & kernel 版本】RedHead 7.4
  • TiDB 版本】2.1
  • 磁盘型号
  • 集群节点分布】 2TiDB, 2PD, 5TiKV
  • 数据量 & region 数量 & 副本数
  • 问题描述(我做了什么)
    我在TiDB的监控页面发现有一台TiKV掉线(具体掉线时间不确定)我今天在中控机上,通过“ansible-playbook start.yml -l”命令启动tikv,发现启动失败,在tikv.log中没有产生日志。我查看"/var/log/messages"中发现如下信息:
    ,日志显示,从14日开始
    系统在循环启动tikv,但一直启动失败
  • 关键词】TiKV启动失败

我们官方建议的操作系统版本是要求7.3以上,否则可能存在一些兼容性问题,trap invalid opcode是指令集兼容问题,这边建议可以的话先升级一下操作系统版本

我之前写的信息有误,我的RedHead的版本是7.4,不是7.2

看下/var/spool/abrt目录下有没有生成什么内容文件,有的话上传一下

/var/spool/abrt下没有文件

建议参考官方扩缩容步骤,重新部署这个tikv节点 https://pingcap.com/docs-cn/dev/how-to/scale/with-ansible/

我按照扩缩容的方式已经试过了,在扩容的时候,还是起不来这台tikv

这台TiKV节点在故障之前有没有做过什么操作,操作系统之类的

没有进行过其他的操作

参考这个链接:https://blog.csdn.net/vic_qxz/article/details/80452426

通过升级到3.0.4版本,问题得到解决

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。