TIKV内存使用率95%

Jellybean · 2024 年4 月 23 日 16:53

楼主问集群能否重启，首先你要确认是测试环境还是生产环境，如果重启会有什么风险。
考虑到你这边对TiDB还不是特别了解，可以先确认有什么业务在访问，集群异常会影响到谁，先通知到位。

然后再来调整这个内存使用高的问题，tikv使用内存过高是很少见的，大部分场景是因为同一台机器部署了多个节点导致资源竞争厉害，或者是tikv的参数 storage.block-cache.capacity 配置不合理，先往两个方向排查和确认，如果是就可以针对性解决。

YuchongXU · 2024 年4 月 23 日 22:35

加油了，试试万能的重启

呢莫不爱吃鱼 · 2024 年4 月 24 日 00:24

用tiup来操作吧

tidb菜鸟一只 · 2024 年4 月 24 日 00:32

这边不建议重启，你直接先看下storage.block-cache.capacity这个值设置多少
SHOW config WHERE NAME LIKE ‘%storage.block-cache.capacity%’;
然后修改为原来的一半左右，参数立即生效，内存很快释放。
SET config tikv storage.block-cache.capacity=10G;

shigp_TIDBER · 2024 年4 月 24 日 00:36

tikv内存使用95%,有性能问题吗？有影响业务吗？如果没有，通过日志，dashboard来分析原因；如果有，跟业务方沟通确认是否可以重启

zhanggame1 · 2024 年4 月 24 日 01:10

每个服务器都登录下试试tiup命令能不能运行，root和tidb用户都试试

zhang_2023 · 2024 年4 月 24 日 01:11

直接重启风险太大

forever · 2024 年4 月 24 日 01:34

只是单纯的高，还是有性能问题了

逍遥_猫 · 2024 年4 月 24 日 01:59

1、每个机器which tiup看中控在那台机器上
2、是否混合部署？
3、看下storage.block-cache.capacity这个值
修改 SET config tikv storage.block-cache.capacity=10G; 不是混合部署的情况下给机器内存的45% 左右
3、看监控 granfa 的 tikv detail → rocksDB KV → Block cache size 是否在storage.block-cache.capacity 设置的范围内
4、可直接重启对应 node 降低内存

洪七表哥 · 2024 年4 月 24 日 02:37

重启解决一切

TiDBer_QYr0vohO · 2024 年4 月 24 日 03:06

有没有混合部署呢

stokcli · 2024 年4 月 28 日 02:12

试试重新启动不知道服务器具体配置也不好下结论

有猫万事足 · 2024 年4 月 28 日 09:25

你中控机都找不到还要重启这个tikv实例？你确定这样不会背锅嘛？
如果是离职交接的原因该叫就叫啊。现在叫不会是你的错，但是你不叫，重启出了问题，肯定就是你的问题了。

这里介绍不了我 · 2024 年4 月 28 日 10:30

这也太离谱了交接的，谨慎操作

不想干活 · 2024 年4 月 29 日 06:46

想办法甩锅吧

zhh_912 · 2024 年5 月 12 日 09:50

先看操作系统的日志

yytest · 2024 年5 月 13 日 00:30

如果tiup重启集群，不行再重启主机试试。

TiDBer_rvITcue9 · 2024 年5 月 13 日 01:39

找集群文件采集信息吧

友利奈绪 · 2024 年5 月 13 日 01:41

这种不好搞啊谨慎操作

健康的腰间盘 · 2024 年5 月 13 日 06:54

众所周知，百分之95的问题可以靠重启解决