tikv节点磁盘异常,可以直接停止该节点 ,然后替换磁盘 重启吗

【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】
【复现路径】做过哪些操作出现的问题
【遇到的问题:问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件:截图/日志/监控】

请问下,一个tikv节点 (2个实例) 部署在阿里云的ecs上,目前出现了磁盘告警,需要进行 替换维护,替换维护后磁盘会被初始化, 可以直接停止 该节点上的两个实例,然后等维护完,在重新启动实例,等数据内部均衡吗

扩缩容吧。

1 个赞

扩缩容 需要等待内部数据下线,时间有点长。 tidb是多副本,按上面的操作是有啥风险性吗

磁盘初始化是数据全部格式化么?这样的话部署目录等都被清理了。
服务器恢复是启动不了的。不如正常扩缩容。

是初始化 挂载的磁盘,可以把部署目录备份到系统盘,这种的不会格式化

:thinking: 那感觉也不是不行。记得调整下 pd 里面 max down time ,避免补数据。然后目录备份的时候记得进程都关掉备份。

不确定有没有坑,你可以试试。

2个实例建议还是正常进行扩缩容操作吧

这种备份不会数据目录,在节点重新拉起来后, 这个节点 tidb会自己补数据吗

不能直接停止吧。如果在事务上,造成不一致,会造成致命错误的。

应该按照标准做法,先缩容再扩容

一个kv一个kv替换吧,不能2个一起替换。

云主机挂载一个大容量盘上去。扩容操作数据路径指向它。然后缩容有问题的实例。

先扩容一个新的tikv,再将有问题的tikv节点下线

一般都是采用扩缩容的方式,这样还可以避免影响在线业务影响,这样不是更好?

直接下还是风险太大,扩容一个一个下

一个个来,扩一个,换完,然后缩容一个,再去扩容

你的集群部署情况说明下,一共几个tikv节点,整个集群的拓扑情况。

此话题已在最后回复的 60 天后被自动关闭。不再允许新回复。