【TiDBer 唠嗑茶话会 134】🔍 分享你的集群诊断经验！遇到XX问题时，哪些监控指标应该首先关注？

xfworld · 2024 年9 月 7 日 00:59

嗯，告警部分只关注节点服务的死了，还是活着
其他的，按照实际的场景进行排查了

大概这样几项已经很受用了

洪七表哥 · 2024 年9 月 7 日 01:06

要看资源使用情况和SQL情况

小小橙兜 · 2024 年9 月 7 日 02:18

查看资源使用率，然后观察日志输出情况就那些分析…

ti-tiger · 2024 年9 月 7 日 05:56

用Dashboard看慢查询比较多

小龙虾爱大龙虾 · 2024 年9 月 7 日 06:35

出问题先看业务着急不着急

virvle · 2024 年9 月 7 日 08:30

观察CPU,内存和磁盘IO情况，再查看慢SQL

changpeng75 · 2024 年9 月 7 日 10:38

先看Dashboard，慢SQL情况。

wangcw · 2024 年9 月 7 日 11:37

优化慢SQL看Dashboard

我是人间不清醒 · 2024 年9 月 7 日 14:49

1 dashboard qps 集群状态
2 慢sql 情况
3 加索引，绑定执行计划

Jellybean · 2024 年9 月 7 日 16:43

Dashboard从整体把控，大部分问题排查可以从这里入手，尤其是分析慢sql和热点问题特别有帮助

koby · 2024 年9 月 8 日 02:53

开发反馈数据库慢，先排查是否有慢SQL导致，其次看服务器内存，CPU，磁盘IO使用情况。

FutureDB · 2024 年9 月 8 日 07:49

先看Grafana Overview的System Info看下整体资源情况，然后再根据时间点和具体问题，查看问题时间段内Dashboard的慢SQL、Top SQL或者Grafana具体组件面板的监控指标进行具体分析。

FoolishPike · 2024 年9 月 8 日 09:45

先关注数据库的索引使用情况、服务器的 CPU 和内存利用率

TiDBer_Anthony · 2024 年9 月 8 日 09:48

优化慢SQL看Dashboard，再看资源使用情况

TiDBer_pig · 2024 年9 月 8 日 10:11

Dashboard的sql响应时间

TiDBer_sao游 · 2024 年9 月 8 日 10:17

Grafana + Dashboard

TiDBer_LM · 2024 年9 月 8 日 10:56

先看服务器是不是活着，哈哈哈哈

wangcw · 2024 年9 月 9 日 00:30

首要肯定是抓慢SQL，看执行计划，合理利用下索引最有效了。

TiDBer_刚 · 2024 年9 月 9 日 00:46

一般看CPU、定位慢SQL，查看执行计划

wfxxh · 2024 年9 月 9 日 00:54

先看集群整体负载，再看是否有慢查询