【 TiDB 使用环境】 类似冗余日志数据使用场景
【概述】准备操作unsafe recover
【背景】迁移数据后,drop原表,按照库表的数量,只剩下1/20的迁移不动报错的分表了;但是tikv节点磁盘空间一直没有释放,监控图容量还是330T+,看后台gc的tidb节点,好多报错信息:
[INFO] [client_batch.go:525] [“recycle idle connection”] [target=172.xx.xxx.xxx:20160]
[ERROR] [client_batch.go:278] [“batchRecvLoop error when receive”][target=172.xx.xxx.xx:20160] [error=“rpc error: code = Unavailable desc = transport is closing”] [stack=“github.com/pingcap/tidb/store/tikv.(*batchCommandsClient.batchRecvLoop
\t/home/jenkins/workspace/release_tidb_3.0/go/src/github.com/pingcap/tidb/store/tikv/client_batch.go:278”]
【现象】grafra监控显示集群容量还是300T+
【TiDB 版本】Server version: 5.7.25-TiDB-v3.0.3 MySQL Community Server (Apache License 2.0)
这是之前的记录信息,今天进行了/data0/tidb/tikv-ctl --db /path/to/tikv/db unsafe-recover remove-fail-stores -s 22 --all-regions操作,操作之前已经stop tidb集群,但是却没有按照文档https://docs.pingcap.com/zh/tidb/v3.0/tikv-control/#强制-region-从多副本失败状态恢复服务中的提示返回sucess,而是返回的信息是:
removing stores [22] from configrations…
Debugger::remove_fail_stores: “Store 22 in the failed list”
之后tikv-ctl 进程就结束退出了。