TiKV组件OOM后,执行SHOW STATS_HEALTHY;查询不到任何数据

【 TiDB 使用环境】生产环境 /测试/ Poc
【 TiDB 版本】5.7.25-TiDB-v5.3.0
遇到的问题:TiKV组件OOM后,执行SHOW STATS_HEALTHY;查询不到任何数据。
Master|root@(none)>show stats_healthy where table_name = ‘table_name’;
Empty set (0.00 sec)

需要重启TiKV组件才能恢复,这是为什么?

看你的描述,有两个问题:
1.tikv oom问题

  • 请确认一下dashboard 语句分析和慢查询情况,找到大SQL。
  • 确认tikv的block cache 配置大小情况,是不是太大了。如果是单机部署多个节点的场景,要更加小心配置该参数。

2.无法查看统计信息健康度STATS_HEALTHY的问题。
请问这个能否复现问题?
排查问题时段,查看有没有异常的集群日志,包括tidb和tikv的log,都确认一下。

display看看集群状态是否正常

我猜测是TiKV组件OOM后,内存中的元数据信息清零,所以查不到,重启后会重新加载

过段时间再试试,有可能正在将元数据信息加载到内存中

他估计过了很长时间了

加载时间有点长吧,看看TiKV的CPU和内存变化状况以及健康状态

集群拓扑图发一下,另外看下tikv的SHOW config WHERE NAME LIKE ‘%storage.block-cache.capacity%’
storage.block-cache.capacity,机器上tikv是单实例的话,设置为内存总量的45%,多实例的话,再除以实例数。