三台tikv,其中一台内存昨天突然预警,目前内存占用还没有下去

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • 【TiDB 版本】:3.0.12
  • 【问题描述】:

三台tikv,其中一台内存昨天突然预警,目前内存占用还没有下去.
目前分析应该是20:00点左右qps增高导致,但是怎么让现在空闲期怎么内存使用降下去


  1. 看下你的 tikv 配置文件中 block cache 配置的值, 是115 这个服务器吧,看起来就是 block cache 占用的
  2. 这个服务器总的内存是多少? 3.这个服务器是单tikv 吗,还有其他实例吗? 执行 top 反馈下结果
  3. 哪里预警了? 超过多少阈值告警?

1.默认安装时候的block cache,没有修改过


2.服务器总内存8.0,可用内存7.6
单例的tikv,不过机器上安装了其他服务(tikv、kafka、zookeeper、pump)
目前除了tikv占用4.3还有kafka占用1.3,其他的没有大的任务了

3.预警监控内存剩余量,少于300M预警

注:之前也有过大量数据的写入,但是没有出现过这种内存一直占用很高的情况

  1. 麻烦反馈下 over-view ,tidb ,tikv 的监控

  2. 麻烦反馈tikv.log 和 tidb.log ,多谢

over-view ,tidb ,tikv 的监控是指什么?

tikv.log (503.3 KB) tidb.log (1.8 MB)

  1. 指的是 grafana 的监控,看一下你配置的ip 和端口

(1)、chrome 安装这个插件https://chrome.google.com/webstore/detail/full-page-screen-capture/fdpohaocaechififmbbbbbknoalclacl

(2)、鼠标焦点置于 Dashboard 上,按 ?可显示所有快捷键,先按 d 再按 E 可将所有 Rows 的 Panels 打开,需等待一段时间待页面加载完成。

(3)、使用这个 full-page-screen-capture 插件进行截屏保存

  1. 反馈信息
select VARIABLE_NAME, VARIABLE_VALUE from mysql.tidb;
MySQL [(none)]> select VARIABLE_NAME, VARIABLE_VALUE from mysql.tidb;
+--------------------------+--------------------------------------------------------------------------------------+
| VARIABLE_NAME            | VARIABLE_VALUE                                                                       |
+--------------------------+--------------------------------------------------------------------------------------+
| bootstrapped             | True                                                                                 |
| tidb_server_version      | 35                                                                                   |
| system_tz                | Asia/Shanghai                                                                        |
| tikv_gc_leader_uuid      | 5bf0b79c6500009                                                                      |
| tikv_gc_leader_desc      | host:tidb, pid:4193, start at 2020-01-20 20:12:35.622800493 +0800 CST m=+5.228438341 |
| tikv_gc_leader_lease     | 20200521-14:20:35 +0800                                                              |
| tikv_gc_enable           | true                                                                                 |
| tikv_gc_run_interval     | 10m0s                                                                                |
| tikv_gc_life_time        | 10m0s                                                                                |
| tikv_gc_last_run_time    | 20200521-14:16:35 +0800                                                              |
| tikv_gc_safe_point       | 20200521-14:06:35 +0800                                                              |
| tikv_gc_auto_concurrency | true                                                                                 |
| tikv_gc_mode             | distributed                                                                          |
+--------------------------+--------------------------------------------------------------------------------------+
13 rows in set (0.00 sec)

MySQL [(none)]>

tidb


tikv

麻烦反馈完整的监控,多谢

怎么导出?

参考这里

链接:https://pan.baidu.com/s/1kzoryfmD5Dz_cWaVdhCnxA 提取码:zfx8 复制这段内容后打开百度网盘手机App,操作更方便哦

图片太大,上传不了。上面图片是处理过的,不清楚

感谢,这个主要还是因为 block cache 占用太多,占用后不会释放,所以如果要降低,重启后释放。如果需要控制在某个值以下,需要修改block cache 值,

注意: block cache主要缓存数据,如果过小,会导致性能下降

应该会自动释放的吧?为什么现在没有释放?每次都要重启才能释放吗?

和研发同事确认了下,不会释放

1.block cache的值默认是1G,现在上升到1.5不能自动释放?还是说参数没有默认值?
2. block cache设置的值是能占用的固定的值吗?不能动态的调整?

  1. image

  2. 是的,不能动态.