【TiDBer 唠嗑茶话会 138】你有哪些 TiDB 故障排除经验?

TiDB 4.0 引入了 SQL 诊断功能,通过系统表的方式向上层暴露集群信息,包括集群拓扑、硬件信息、软件信息等。这使得用户可以通过 SQL 查询来获取这些信息,从而提升问题定位的效率。

2 个赞

常规套路:
1.tiup检查集群状态
2.dashboard查看slow query\日志
3.Grafana查询各种Metrics监测指标
4.查看系统DDL日志、PD元数据
不走寻常路:
restart \upgrade

dashboard+Grafana+日志

使用 dashboard 查看慢查询 sql,并结合业务实际场景对 sql 进行优化。

先查日志吧

故障现象:系统备份失败。
原因分析:备份不成功是偶发,说明脚本没问题。分析日志,发觉可能原因是leader发生切换导致TSO获取问题从而导致备份失败。

目前只会利用dashboard定位

这么好的课程为啥不限期公开呢? 现在用tidb 对排障完全没有思路

1 查看监控指标数据
2 产看日志信息
3 不行重启看看

感谢大家参与本期唠嗑茶话会!积分奖励已发放~

此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。