TiDB从3.0.2升级到3.0.5之后出现了大量的empty-region告警

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • TiDB 版本】:

3.0.5

  • 问题描述】:

如标题所述,今天上午我们的TiDB集群从3.0.2升级到3.0.5,为了解决关于GC的问题。现在GC已经恢复,但是在region health监控页面出现了empty-region-count的告警。

下面附上一些grafana的监控页面:

  • 集群大小及region数目概况

  • 最近6小时pd监控情况

在这里我想确认下,这些empty region是不是一直都存在TiDB集群中的,只是更新版本之后这些信息显示出来了而已?

这些空的region也就是 region size 为1M的region,是不是可以通过merge消除的呢?

这里看到的值和grafana上看到的告警的值基本一致的。

  1. 刚才跟研发这边确认了一下,这个是 v3.0.5 版本新增加的统计项。

  2. 从监控上面看现在是正在做 region merge 的,empty 的数量也在减少。具体符合条件的 region 数可以通过 pd-ctl 工具查询:./bin/pd-ctl -d region | jq ".regions | map(select(.approximate_size < 20 and .approximate_keys < 200000)) | length"

1赞