整个数据库有很多insert很慢

像风一样的男子 · 2022 年3 月 10 日 08:37

为提高效率，请提供以下信息，问题描述清晰能够更快得到解决：
【 TiDB 使用环境】
阿里云服务器搭建
3PD 5KV tikv 为16核32G内存均为ssd磁盘
【概述】场景 + 问题概述
慢查询有很多insert 时间超过四秒钟，数据库平均qps 2K左右
【背景】做过哪些操作

【现象】业务和数据库现象

【问题】当前遇到的问题

【业务影响】

【TiDB 版本】
tidb 4.0.9
【应用软件及版本】

【附件】相关日志及配置信息

若提问为性能优化、故障排查类问题，请下载脚本运行。终端输出的打印结果，请务必全选并复制粘贴上传。

像风一样的男子 · 2022 年3 月 10 日 08:38

请问我应该怎么排查问题？

songxuecheng · 2022 年3 月 10 日 08:56

像风一样的男子 · 2022 年3 月 11 日 02:04

排查下来就是这个
Storage async snapshot duration偏高请问这个应该怎么处理

h5n1 · 2022 年3 月 11 日 02:37

看下tikv的几个scheduler和其他几个线程的CPU利用率还有磁盘IO情况

xfworld · 2022 年3 月 11 日 02:38

这是 IO 有瓶颈了么？还是 CPU 处理跟不上？

像风一样的男子 · 2022 年3 月 11 日 02:42

这是期中一个kv的内存cpu磁盘读写监控

songxuecheng · 2022 年3 月 11 日 02:54

阿里云吗。是使用的什么磁盘？

像风一样的男子 · 2022 年3 月 11 日 02:54

阿里云的ssd

songxuecheng · 2022 年3 月 11 日 02:56

要看具体的iops，但据我知道的好像是根据大小的。

数据小黑 · 2022 年3 月 11 日 02:57

tidb的grafana->overview->System Info->IO Util,麻烦截个图看看

像风一样的男子 · 2022 年3 月 11 日 03:10

这个参数我查了下只是针对机械硬盘有效 ssd监控不准确

数据小黑 · 2022 年3 月 11 日 03:20

集群现在还在正常负载么？能上传个集群诊断么？

像风一样的男子 · 2022 年3 月 11 日 03:28

TiDB Dashboard Diagnosis Report.mhtml (860.3 KB) 这个是昨天到现在的区间诊断报告

数据小黑 · 2022 年3 月 11 日 03:58

我目前的排查：

怀疑latch高，为了验证，是否可以截取：grafana->TiKV Details->Scheduler-commit->Scheduler latch wait duration看一下，另外，配置文件改过哪些参数，是否可以说一下？

qizheng · 2022 年3 月 11 日 04:11

根据之前的压测经验，将阿里云盘升级到 ESSD PL3 型，磁盘才不会成为瓶颈，获得相对稳定的性能

xfworld · 2022 年3 月 11 日 04:23

这个是不是很贵～

songxuecheng · 2022 年3 月 11 日 04:44

我以前用过阿里云。确实需要达到ESSD 之后才可以满足iops。好像记得一个月8000多（打折）

像风一样的男子 · 2022 年3 月 11 日 05:02

没有修改过配置文件

像风一样的男子 · 2022 年3 月 11 日 05:20

我的阿里云磁盘是pl1标准是5万iops 实际iops是5000 应该没达到瓶颈吧