为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。
- 【TiDB 版本】:3.0.11
- 【问题描述】:
环境:3台服务器,每台服务器2个kv实例,共6个实例
现象:一个kv实例某一时段cpu很高,导致那个时段查询很慢,但是看pd热点监控信息,并不高
以下是监控:
TiDB监控:
![tidb04](https://asktug.com/uploads/default/original/3X/4/1/4101465b822bbc1d1e4045f22db828744aef12b4.png)
![tidb05](https://asktug.com/uploads/default/original/3X/3/8/38fe55bda795942245e7733e35ef234eb9af5754.png)
TiKV监控:
![tikv04](https://asktug.com/uploads/default/original/3X/c/9/c9fd94f703a73e7e960308f15677e52048621bf0.png)
![tikv08](https://asktug.com/uploads/default/original/3X/e/f/ef12c282a9929ef23e9b75058f796bd92b7e0995.png)
![tikv09](https://asktug.com/uploads/default/original/3X/c/9/c90d0c59bbf6b0535079da82977b7a792076a9bf.png)
![tikv10](https://asktug.com/uploads/default/original/3X/0/5/05b78a86badb9a2923704afeefd0d7e1ca1fe07e.png)
PD热点监控:
若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出打印结果,请务必全选并复制粘贴上传。
为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。
现象:一个kv实例某一时段cpu很高,导致那个时段查询很慢,但是看pd热点监控信息,并不高
以下是监控:
若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出打印结果,请务必全选并复制粘贴上传。
您好 已经看了过这篇热点处理文章了,和这里面说的基本一致,这里说热点调度被抢占在2.1.14解决了,但是我们的版本是3.0.11,还有就是我在主题里发的PD上监控指标Hot read Region’s peer distribution那个时段里的每个Kv实例读取leader都很低相比其他时段
1、看 tidb 的监控 connection count 正常水平都高,业务压力或者访问逻辑是否有变化?另外,这些 SQL 是大查询吗?
2、如果方便的话能否提供下,异常时间段的 TiDB 以及 TiKV-details 的监控,便于分析问题。导出方式如下:
1)chrome 安装这个插件 https://chrome.google.com/webstore/detail/full-page-screen-capture/fdpohaocaechififmbbbbbknoalclacl
2)鼠标焦点置于 Dashboard 上,按 ?可显示所有快捷键,先按 d 再按 E 可将所有 Rows 的 Panels 打开,需等待一段时间待页面加载完成。
3)使用这个 full-page-screen-capture 插件进行截屏保存
3、如果不能提供所有的监控,那么希望提供下出现问题的时间段那个 cpu 高的 store 节点下述监控面板:
1)选择目标 store 节点
2)上传下述监控面板信息