tidb 插入慢不知道消耗在哪里?

为提高效率,提问时请提供以下信息,问题描述清晰可优先响应。

  • 【TiDB 版本】:tidb Version: v4.0.6
  • 【问题描述】: 3tidb +3tikv +tiflash ,一台机器(1tidb和1tikv )每台32C 96G内存 本地SSD,tiflash 一台(48c 128g内存 本地SSD),总共4台
    通过dm 工具从mysql 分表同步数据到tidb 发现插入缓慢在量大的时候,有dm延迟超过5分钟,不知道是否是表数据大的原因,还是哪里原因,订单表数据大概3亿数据量,是否有办法提升,降低写入延迟

若提问为性能优化、故障排查类问题,请下载脚本运行。终端输出的打印结果,请务必全选并复制粘贴上传。

订单表每天数据量大概2800万的增速

帮顶一下

今天扩了两台tikv服务器还是不行

麻烦反馈下在写入延迟比较高的时间段的监控面板数据,包括 overview、tidb、pd、tikv-detail和 tikv-throuble-shotting ,可参考下面的方式导出:

lx-pro-mars-Cluster-TiKV-Trouble-Shooting_2020-11-23T14_07_20.218Z.json (2.9 MB)

如附件,不知道是否够用

tidb打包.zip (614.6 KB)

我都下载下来打包了


从监控导出的时间段来看,集群的 duration 并不是很高,是不是导出时间没有选对,并且导出的监控中很多监控项没有展开所以没有监控数据。

  1. 打开 Grafana 监控面板(先按 d 再按 E 可将所有 Rows 的 Panels 打开,需等待一段时间待页面加载完成)
  2. https://metricstool.pingcap.com/ 使用工具导出 Grafana 数据为快照

建议重新导出一下插入慢的时候,完整的监控数据。

重新收集如附件tidb信息收集.zip (6.2 MB)

自己给自己顶下

1、你的盘 IO 使用已经很高,建议看看盘延迟情况:disk—performance 下
2、建议你打散一下热点,你写入有热点情况
3、目前集群有不少 慢 SQL ,建议优化一下

1、你的盘 IO 使用已经很高,建议看看盘延迟情况:disk—performance 下 --》这个从哪里看iostat看吗
2、建议你打散一下热点,你写入有热点情况 --》从哪里看有热点,热点是那张表?
3、目前集群有不少 慢 SQL ,建议优化一下 --》这个是报表业务库会有部分慢sql

1、第一个 disk_performance 是个监控面板
2、热点相关的技术,建议直接官网搜关键字,定位及解决办法,都有

[quote=“spc_monkey, post:15, topic:63753”]
disk_performance
[/quote] 没有看到这个面板,write too slow 是否可以?

写延迟.zip (799.9 KB)

1、看起来盘没问题,先优化 SQL 及打散热点吧

热点可视化 这个监控模板哪里有?我导入进去,定位热点,或者有sql 语句定位热点吗?

我发现我导入的模板没有disk performance 和热点可视化