TIKV 的QPS 显示有800M

TiDBer_mCTc5877 · 2024 年5 月 14 日 10:06

【 TiDB 使用环境】生产环境
【 TiDB 版本】 7.5TIKV
【复现路径】一读多写
【遇到的问题：问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
我们有一个3节点的服务器，每个服务器上两个3.5TIB 的 SSD 。
当前我们的服务是juicefs +TIKV ，我们juicefs 上有 22亿的文件，
我们发现TIKV 的监控的QPS 达到了800M QPS/s 甚至更高，这个感觉不太符合常理，请问下这里是不是有什么问题，
如何修复呀？
【附件：截图/日志/监控】

The-Fallen-Angel · 2024 年5 月 14 日 10:10

写，也是先查出来再做修改，这个qps值是感觉大的不正常？

TiDBer_mCTc5877 · 2024 年5 月 14 日 11:14

我也感觉有点离谱，不知道怎么排查，这里是小白，有什么可以指点的吗？

TiDBer_mCTc5877 · 2024 年5 月 14 日 11:15

这个QPS 我都数不过来了

随缘天空 · 2024 年5 月 14 日 11:44

有热点？

zhh_912 · 2024 年5 月 14 日 15:44

看是哪个时间段的，比对下一周的峰值

yytest · 2024 年5 月 14 日 22:48

最好提供一下底层的日志

小于同学 · 2024 年5 月 15 日 01:42

热点导致的吗

zhaokede · 2024 年5 月 15 日 02:12

先从业务上排除一下，看是否业务高峰，近期业务系是否升级等

TiDBer_mCTc5877 · 2024 年5 月 15 日 02:18

不确定什么是热点，我是用作juicefs 的元数据服务，最终暴露的是文件接口。 TIKV 层面没法感知。。。

TiDBer_mCTc5877 · 2024 年5 月 15 日 02:32

我看从2024.4 月中旬上线，到 2024.5月中旬，一直是累积的样子，一直是递增的，不像是别人几千QPS 的样子，

TiDBer_mCTc5877 · 2024 年5 月 15 日 02:33

业务常规使用，从4月份上线，就一直在增加，曲线呈累积的事态，像是数值累加了一样。但也会的模型不会这样的。

有猫万事足 · 2024 年5 月 15 日 02:48

这个图看着不像是grafana的图。是谁提供的？
为啥不去juicefs的社区问问？毕竟是juicefs在用tikv吧？

友利奈绪 · 2024 年5 月 15 日 03:24

排除一下慢语句,慢语句堆积会影响整体并发和整个集群的性能

zhaokede · 2024 年5 月 15 日 04:25

也有这种可能

TiDBer_mCTc5877 · 2024 年5 月 16 日 01:55

这个是抓到的Prometheus 的数据，展示样式不同而已，这个QPS 的值我是想从TIKV 层面看看，是否是显示有问题，想从TIKV 层面判断下是否是异常。

托马斯滑板鞋 · 2024 年5 月 16 日 01:58

不会抓错指标了吧？抓成类似cpu time 、tikv usage 之类的累加值

TiDBer_QYr0vohO · 2024 年5 月 16 日 02:22

可以看到详细的 promsql 吗

有猫万事足 · 2024 年5 月 16 日 06:24

提供一下计算方式吧。有的指标就是一直累加的，展示的时候需要前值减后值。会不会是类似的问题？
没有细节就不清楚是哪里有问题。