tidb集群,服务器tikv负载很高,总共有十几个数据库,如何查看是哪个数据库导致的呢?

为提高效率,请提供以下信息,问题描述清晰能够更快得到解决:

我们的tidb集群v5.0.1版本,上面有很多数据库,前天有4个多小时三台tikv服务器负载很高,cpu高达60%左右,我想知道如何在tidb监控里面查看是哪个数据库导致的负载比较高?谢谢

【概述】场景+问题概述

【背景】做过哪些操作

【现象】业务和数据库现象

【业务影响】暂时没有

【TiDB 版本】5.0.1

【附件】

  1. TiUP Cluster Display 信息

  2. TiUP Cluster Edit Config 信息

  3. TiDB- Overview 监控

  • 对应模块日志(包含问题前后1小时日志)

若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

1 个赞

dashboard 先查看下 SQL 语句分析 ,里面按照耗时等排序,看看是否有大sql.

看了下没发现异常的SQL语句,高负载持续了四五个小时才降下去,是不是tidb系统底层在调整数据导致的?

如果业务没有,那么可以查看detail-tikv 监控,看看cpu主要消耗在哪里? 比如可能是 gc cpu 占用比较多。之前有过大量删除数据的操作。 可以检查下。

好的,我查看下

请问有排查到因为什么问题高负载吗?

没有查出来是什么原因导致的,这又是一个悬案了 :joy:

最近一直在跟踪服务器状态,没再出现这么高的负载了

如果确定是 TiKV 负载高,类似问题要看是哪个库导致的,还是要从 SQL 层面的表信息来确定库信息。比如大 SQL 导致某个 KV 流量高或者热点等,那么慢日志里面应该会有 SQL 信息,可以从 SQL 里面的表来确定库信息。当然也可以在论坛里搜一下负载高问题的可能原因哈。

好的,谢谢

不客气 :ok_hand: