【 TiDB 使用环境】生产环境
【 TiDB 版本】v7.1.1
【复现路径】由v6.1.1 升级至v7.1.1
【遇到的问题:问题现象及影响】
dashboard 监控 概况面板中的延迟数据信息99.9%延迟数据,由升级前的60ms左右涨到升级后的400ms,求大佬帮忙排查问题
wind-Performance-Overview面板中的 KV Request Time By Source和另外两个 有明显增加,其他指标暂未发现太大变化,详细如下:
【 TiDB 使用环境】生产环境
【 TiDB 版本】v7.1.1
【复现路径】由v6.1.1 升级至v7.1.1
【遇到的问题:问题现象及影响】
dashboard 监控 概况面板中的延迟数据信息99.9%延迟数据,由升级前的60ms左右涨到升级后的400ms,求大佬帮忙排查问题
wind-Performance-Overview面板中的 KV Request Time By Source和另外两个 有明显增加,其他指标暂未发现太大变化,详细如下:
对应的时间点有无慢的SQL
慢sql很少,个别的,升级前后应该变化不大,不应该是慢sql造成的 , 看监控, KV Request Time By Source在升级之后就一下子飚上来了
KV/TSO Request OPS 这个指标信息发一下
Execution Duration 图,增高了,说明 执行 SQL 语句执行计划耗时
KV Request Time By Source 上面发的 这个 ,右边的指标最大的前面几个是啥
图上都到了3分,右边前面才是秒,排个序,看看前面的
Cop-external_Execute 说明 Cop 请求来源于内部的 analyze 操作
show analyze status;
SELECT * FROM information_schema.analyze_status;
SELECT * FROM mysql.analyze_jobs;
看一下,那段时间 analyze 信息
执行计划是不是不一样了,分析表试试
结合您的意见,我也特意去看了升级之后表分析的任务,发现并没有太多的增加,而且从升级到现在,这个KV Request Time By Source 的时间一直处于高位,即使当前没有发现有后台的表分析任务
在观察观察,多收集点信息
大版本对于数据处理上还是有些差别的,生产环境升级还是要谨慎点
KV Request Time By Source 高位的还是 cop么
持续观察下
这延迟怎么这么大 是不是非常多慢sql
Commit-external_Commit 、Prewrite-external_Commit,说明消耗时间最高的 KV 请求为 Commit 和 Prewrite,并且来源于外部的 Commit 语句。
页面显示的都是 external 的信息,是kv外部
看下tidb 那时间段的监控信息,有啥异常
请问具体要看哪些指标