关闭 pump 组件,tidb 重启失败

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • 【TiDB 版本】:2.13
  • 【问题描述】:kill pump之后集群出现报错,stop之后在start也启动不起来,更新配置文件去掉pump和drainer也是启动不了,报错如下

你好,

pump 的状态会影响 tidb 集群的写入,目前可以将 inventory 文件中 enable_binlog 设置为 False,并 rolling_update.yml -t tidb。

之前就是有设置未false的,rolling_upodate的时候报下面的错误

之前部署的时候都没有报这个错误,哪里可以取消这个检测呢

image
tikv节点都是这个问题,只检出这个报错

你好,

如果你的数据盘已经格式化成 ext4 并挂载了磁盘,可先执行 umount /dev/nvme0n1p1 命令卸载,从编辑 /etc/fstab 文件步骤开始执行,添加挂载参数重新挂载即可。

譬如:

  1. 编辑 /etc/fstab 文件,添加 nodelalloc 挂载参数。
vi /etc/fstab
UUID=c51eb23b-195c-4061-92a9-3fad812cc12f /data1 ext4 defaults,nodelalloc,noatime 0 2
  1. 挂载数据盘。
mkdir /data1 && \
mount -a
  1. 执行以下命令,如果文件系统为 ext4,并且挂载参数中包含 nodelalloc ,则表示已生效。
mount -t ext4
/dev/nvme0n1p1 on /data1 type ext4 (rw,noatime,nodelalloc,data=ordered)

目前并不推荐注释磁盘相关的检测。如果需要注释掉相关检测也在看下
https://github.com/pingcap/tidb-ansible/blob/d51726807e207c23d734c650b77dc1a3d28ddf1f/roles/tikv/tasks/check_filesystem.yml#L33-L60

操作中提示磁盘busy,后面我注释掉之后就可以了,谢谢。

好的,并不建议这样注释,目前使用 tidb 版本较低建议升级下,集群恢复以后建议根据文档中的方式进行 ext4 的设置。

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。