为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。
- 【TiDB 版本】:3.0.7
- 【问题描述】:我们用一个TIDB物理库创建了12个逻辑库,做不同业务的负载,在晚间高峰期,一个业务突然出现大量接口异常,查询发现是这个业务的数据查询慢。其他的业务逻辑库都没有受到影响。这种情况应该怎么排查呢?
若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。
为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。
若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。
没有特别慢或者特别多的慢查询,但是发现很多1S+时间的update,会是这个影响的么。
(2)、鼠标焦点置于 Dashboard 上,按 ?可显示所有快捷键,先按 d 再按 E 可将所有 Rows 的 Panels 打开,需等待一段时间待页面加载完成。
(3)、使用这个 full-page-screen-capture 插件进行截屏保存
1.其他库业务还更多,但是没有影响。现在就两个库有影响。
2.昨晚影响的部分时间监控截图
orver-view:
https://tidb-image.obs.ap-southeast-1.myhuaweicloud.com/over-view.png
tidb:
https://tidb-image.obs.ap-southeast-1.myhuaweicloud.com/tidb-1.png
https://tidb-image.obs.ap-southeast-1.myhuaweicloud.com/tikv-detail-1.png
https://tidb-image.obs.ap-southeast-1.myhuaweicloud.com/tikv-detail-2.png
https://tidb-image.obs.ap-southeast-1.myhuaweicloud.com/tikv-detail-3.png
disk-performance:
您好:
1. 从上面的监控看,总的duration都在500ms以下,怀疑点在于有些tikv的IO达到了100%,23:30-23:40的时候coprocessor有些error。
在这一段时间内断断续续的时好时坏周期都很长,看了慢查询,没有异常,大量的慢查询,稍后上个慢查询的语句,在那个时间段有一个活动,可能造成短时间的大并发,大概一小时一次,一次并发写入在3000 - 4000个事务单位。昨晚在截图的时间端有做增加索引的操作。
此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。