Region层面日志信息

【 TiDB 使用环境】测试
【 TiDB 版本】pingcap/tikv:v8.1.0

能否看到region层面的日志呢? 比如现在有集群某个节点故障,有多个region需要迁移, 我想查询到最晚的恢复可用的region的恢复时间, 能否查询到呢?

通常不需要你手动一个个region查过去。

如果是3副本坏1个,集群可以自己恢复。
如果是3副本坏2个,集群不可用。需要unsafe recovery

https://docs.pingcap.com/zh/tidb/stable/online-unsafe-recovery#online-unsafe-recovery-使用文档

这个过程只需要你指定坏掉的2个store id,恢复过程会自动去找可用的regoin做leader并补充副本。

3 个赞

我们是出于一些测试目的想要获取这些信息, 如果可以的话,还想获取一些region调度相关的日志或者记录信息,比如热点region调度这些 :joy:

1 个赞

原来如此,这个我还没有什么特别好的办法。
看看是否有其他大佬提供方案。

访问TiDB Dashboard查看Region信息

  • 在左侧菜单中选择“Region”选项。
  • 你可以在这里看到所有的Region及其状态,包括迁移状态。
  • 通过筛选和排序,可以找到最近恢复的Region及其恢复时间。

我们这边测试都不看这个 人家就看内存CPU 波动

1 个赞

想下载一个 使用以下

大佬可以看看是在哪里吗? 我界面上没看到诶 :joy:

tikv 和 pd 的日志会记录,但是这个日志量很大,不确定你能否筛选出你想要的信息

1 个赞

可以讲讲怎么用 cluster_log查询吗? 或者kubectl logs里面怎么去翻呢? :joy:

那要看你要看什么信息了,我建议你先研究下pd的监控 大部分 region的调度情况都在监控能看出来,除非你要精确到具体某一个region 或者精确到秒级别 否则看监控就行了

好的,谢谢大佬,这部分有什么适合参考的文档吗

https://docs.pingcap.com/zh/tidb/stable/grafana-pd-dashboard#pd-重要监控指标详解 可以看下这个

只觉得看着挺复杂的