升级v7.1.1后延迟大大增加

【 TiDB 使用环境】生产环境
【 TiDB 版本】v7.1.1
【复现路径】由v6.1.1 升级至v7.1.1
【遇到的问题:问题现象及影响】
dashboard 监控 概况面板中的延迟数据信息99.9%延迟数据,由升级前的60ms左右涨到升级后的400ms,求大佬帮忙排查问题

wind-Performance-Overview面板中的 KV Request Time By Source和另外两个 有明显增加,其他指标暂未发现太大变化,详细如下:

对应的时间点有无慢的SQL

慢sql很少,个别的,升级前后应该变化不大,不应该是慢sql造成的 , 看监控, KV Request Time By Source在升级之后就一下子飚上来了

KV/TSO Request OPS 这个指标信息发一下

Execution Duration 图,增高了,说明 执行 SQL 语句执行计划耗时

升级后变小了

KV Request Time By Source 上面发的 这个 ,右边的指标最大的前面几个是啥

图上都到了3分,右边前面才是秒,排个序,看看前面的

  1. kv request total time
  2. Cop-external_Execute

Cop-external_Execute 说明 Cop 请求来源于内部的 analyze 操作

show analyze status;
SELECT * FROM information_schema.analyze_status;
SELECT * FROM mysql.analyze_jobs;

看一下,那段时间 analyze 信息

执行计划是不是不一样了,分析表试试

结合您的意见,我也特意去看了升级之后表分析的任务,发现并没有太多的增加,而且从升级到现在,这个KV Request Time By Source 的时间一直处于高位,即使当前没有发现有后台的表分析任务

在观察观察,多收集点信息

大版本对于数据处理上还是有些差别的,生产环境升级还是要谨慎点

KV Request Time By Source 高位的还是 cop么

持续观察下

这延迟怎么这么大 是不是非常多慢sql

Commit-external_Commit 、Prewrite-external_Commit,说明消耗时间最高的 KV 请求为 Commit 和 Prewrite,并且来源于外部的 Commit 语句。

页面显示的都是 external 的信息,是kv外部

看下tidb 那时间段的监控信息,有啥异常

请问具体要看哪些指标