如何正确修改Capacity size并防止硬盘写满?

  • 【TiDB 版本】:4.1.0-alpha
  • 【问题描述】: 你好,我的集群之前经常写满硬盘,因此在ansible中配置了tikv.yml的raftstore capacity项,然后 deploy 并 rolling_update了,但是grafana上的tikv-details界面的Capacity size依然是旧值,而且最近又写满了一次。 但是用pd-ctl store看,capacity是配置后的值。 请问如何让capacity size正确生效呢?

1、磁盘使用率相关的问题,建议通过监控 + 告警的方式实现,在无扩容计划的前提下,定期清理无效日志及数据,而不是通过下述 TiKV 参数:

PD 需要使用这个值来对整个集群做 balance 操作,设置该值会在一定程度上影响 PD 调度,如 region 、leader 的调度。

2、tikv-details 监控面板中 cluster --> srore size / Available size / capacity size 三者的关系如下:

capacity size 约为 store size + Available size

并且监控中的 capacity size 显示的是 deploy 目录在操作系统的空间,并不是上述参数定义的值

3、生产环境不建议使用 4.x-alpha 版本,建议使用 3.0.9 稳定版本

好的,十分感谢

:+1::+1::+1: