从3.0.8滚动升级至3.0.10,发现empty-regin-count 突然增加很多,什么原因?有没有办法Merge?

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • 【TiDB 版本】:3.0.10
  • 【问题描述】:从3.0.8滚动升级至3.0.10,发现empty-regin-count 突然增加很多,什么原因?有没有办法Merge?

1、empty-regin-count 增加有可能是:

1)当前环境中出现过 drop 或 truncate 操作 2)升级前后可能是空 region 的估算方式发生了变化(待确认)

2、region merge 相关的内容可以看下下面的文章:

  1. 看文档上说的是 “如果 TiKV 不与 TiDB 集群配合运行,建议配置为 ‘default’” 这个怎么理解? 我们现在是 TIKV和TiDB都在使用的,如果配置为’default‘,有没有什么影响?

  2. 需要同时设置split-region-on-table: false吗?

  3. 我的目的是合并空Region,合并完以后,是否可以把 ‘namespace-classfier’ 改回到 ’table‘?

merge 默认情况下表之间是不会相互 merge 的,如果要开启,更改 PD 配置文件,加上 namespace-classifier = “default” (默认是 table), 注:这个参数不能通过 pd-ctl 动态更改。同时,需要将 tikv 的按 table 分裂配置关闭: [coprocessor] split-region-on-table = false

合并完之后,参数是可以在修改的。

求助:在测试环境TiDB集群改了namespace-classifier = “default”,merge起作用了,以下是测试环境Raft store CPU 和 Rigion Health在修改前后的对比

但是在生产环境TiDB集群改了之后,region merge没有起到作用,Raft store CPU没有改善,空Region也么有merge,请问还有什么方法诊断

1、确认以下参数已配置:

1)PD 参数 namespace-classifier = “default”

2)TiKV 参数 split-region-on-table: false

2、pd-ctl show config 提供下 pd 关于 merge 相关的调度参数的配置

3、提供下 pd grafana 中 Operator 监控面板的情况

  1. PD参数

pd.toml

image

  1. TiKV参数

tikv.toml

image

  1. pd-ctl config show

  1. pd grafana 中 Operator 监控面板

1、从 pd 的 merge 相关参数看 region merge 特性是关闭状态: image

2、上述两个参数的默认值分别是,也可以根据实际情况进行调整:

3、调整参数后,请再观察下空 Region 的情况

好,我也观察到这两个参数和测试环境不一样

image

观察pd日志,已经在merge了

感谢感谢!!

好的,如果还有其他问题,可以重新开贴沟通~