启动已down的TiKV导致操作系统OOM进而导致无法备份

为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:
【 TiDB 使用环境】
4.0.8 安全隔离环境 机房在外地
14个TiKV节点,每个2TB SSD

【概述】 场景 + 问题概述
TiDB空间不足,考虑将里面不常用的6TB数据进行导出备份后删除掉

【备份和数据迁移策略逻辑】
根据官方推荐,考虑使用BR工具进行导出

【背景】 做过哪些操作
使用BR导出,但是失败了

【现象】 业务和数据库现象

  1. 目前我们有一个TiKV实例是down的,BR工具需要TiKV全部在线才能导出
  2. 但是这个TiKV实例一旦启动(这台物理机上有4个TiKV实例,3个在运行),很快会消耗大量内存(推测是在同步数据),有几率(历史上遇到过2次)导致机器进入假死状态,只能派人去外地机房进行物理重启(由于疫情不容易安排)
    所以我们目前一直没有启动这个down的TiKV实例

【问题】 当前遇到的问题

  1. 有没有方法能够安全启动TiKV实例
  2. 基于上面的情况是否有什么建议的方法,在保障集群稳定的情况下,完成数据的导出和清理

【业务影响】
再过2周左右,存储空间会耗尽

【TiDB 版本】
4.0.8

【附件】
第一张图是使用BR工具的报错截图
第二张图是集群tikv的状态



若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

先试试用pdctl store delete 8把这个节点下线

用tiup部署的集群会有这个问题,怀疑是少执行最后一步更新集群步骤

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。