建议增加查看tidb、tikv内部资源使用详情的监控

遇到过好多次tidb内存升高后花费很多时间排查的问题,是否可以增加一个监控,内容是tidb、tikv内部的内存、cpu使用情况,维度可以是sql、缓存之类的。这样内存cpu升高后一眼就能看出是哪一块出问题了。

2 个赞

这个想法好,官方可以考虑下

现在占用大量内存,确实应该加个详情

dashboard 里的火焰图,trace 也可以看看,还有些debug信息可以下载。

1 个赞

你这些都太抽象了,有个地方直接能看到不是更好,这个功能出了对比友商就是遥遥领先了。

prometheus 能满足常规情况下的监控和排查了,
你说的情况,可以参考 ShawnYan 提出的火焰图 或者 trace 来跟踪一下

额,我这是给厂商提的产品需求!

好吧,请麻烦尽量在提详细一些,最好能详细到每个功能上的具体要求。

不然会被忽略掉的,对于产品而言价值太低,需要考虑的关联性太多了…

比如期望是功能增强,还是整个能力的整合,还是出一个新的功能视角…

1 个赞

具体监控指标有哪些,展示形式什么样子的,还是再细化细化比较更容易让产品注意到这条建议。

举个例子:在原生MySQL 8.0版本中的sys库中,有如下4个试图,每个试图可以查看到当前实例内存占用详情,对于分析问题特别有帮助、
memory_by_host_by_current_bytes 基于主机的内存占用
memory_by_thread_by_current_bytes 基于线程的内存占用
memory_by_user_by_current_bytes 基于用户的内存占用
memory_global_total 整体MySQLD进程占用的总内存

这个需求实用

好想法,期待官方支持