tiflash 产生了大量的core.*文件,把磁盘打满

另外能否将 /data/tidb-data/tiflash-9000/data/t_549/log/ 这个文件夹的内容打包上传一下?我们内部分析尝试找下原因。

已经上传:链接: 百度网盘-链接不存在 提取码: 3296
里面的t_549目录里的压缩文件

1 个赞

您好,确认一下,是如下操作步骤么
1、根据 TiFlash 剩余节点数调整数据表的副本数

alter table <db-name>.<table-name> set tiflash replica 0;
  1. 通过以下命令确定需要下线的节点名称:
tiup cluster display  tidb-prod
  1. 执行 scale-in 命令来下线节点,假设步骤 1 中获得该节点名为 10.0.1.4:9000
tiup cluster scale-in  tidb-prod --node 10.0.1.4:9000

再进行tiflash扩容
4、添加节点信息到 scale-out.yaml 文件
编写 scale-out.yaml 文件,添加该 TiFlash 节点信息(目前只支持 ip,不支持域名):

tiflash_servers:
  - host: 10.0.1.4

5、 运行扩容命令

tiup cluster scale-out <cluster-name> scale-out.yaml

看上面你提供的信息,集群中只有1个 TiFlash 节点,而且该节点无法启动了。
这种情况下,按照 “通过 TiUP 缩容 TiFlash 节点”,会无法顺利下线 TiFlash 节点。而是需要按照 “ 方案二:手动缩容 tiflash 节点” 来进行 TiFlash 节点的缩容、以及在 PD 中清除同步规则。

扩容的步骤大体上正确。但是在原服务器上重新部署时,建议在 scale-out.yaml 中,给 TiFlash 的端口( tcp_port、http_port、flash_service_port、flash_proxy_port、flash_proxy_status_port、metrics_port)以及路径 deploy_dir、data_dir 都取于上一次部署不同的值。这是防止 PD 和 TiDB 将新部署的 TiFlash 节点和之前手动下线的 TiFlash 节点识别混淆,而引发其他问题。
具体参数格式见 详细 TiFlash 配置模版


删除tiflash store,已经执行正常,没有报错,TiFlash 节点对应的 store 消失
执行第3步时

1、执行缩容时,关闭tiflash进程的命令 所执行的主机在哪?

2、tiup cluster edit-config tidb-prod 删除如下 tiflash节点时,报无法删除
image

请问下现在 tiup cluster display {cluster-name} 还能看到这个 tiflash 节点吗?如果还能的话可以考虑强制缩容下:tiup cluster scale-in {cluster-name} -N {tiflash_ip:port} --force,看下能否成功。

使用 tiup cluster display {cluster-name} 可以看到这个 tiflash 节点,显示状态为Tombstone
下: tiup cluster scale-in {cluster-name} -N {tiflash_ip:port} --force ,下线成功;
然后再使用 ,扩容成功,目前状态正常,在此感谢各位小伙伴的协助

tiup cluster scale-out <cluster-name> scale-out.yaml
tiflash_servers:
  - host: 10.0.1.4

请问这个问题解决了吗?

已经解决了

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。