求助：上游MySQL一跑批，下游TiDB所有tikv IO就飙高

Hacker_小峰 · 2024 年6 月 20 日 08:20

【 TiDB 使用环境】生产环境
【 TiDB 版本】v5.4.3
【复现路径】做过哪些操作出现的问题
【遇到的问题：问题现象及影响】上游MySQL集群通过DM同步到下游一套tidb小集群，tidb主要用作OLAP类查询使用。上游MySQL月底一跑批，下游tidb的所有tikv节点就开始IO告急。
情况如下：

涉及表的表结构如下：

CREATE TABLE `t1` (
  `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
  `aid` varchar(64) NOT NULL COMMENT 'aid',
  `order_no` varchar(64) NOT NULL COMMENT '原订单号',
  `p_code` varchar(64) NOT NULL COMMENT '一级标签',
  `tag_code` varchar(64) NOT NULL COMMENT '标签code',
  `created_by` varchar(45) DEFAULT NULL COMMENT '创建人',
  `updated_by` varchar(45) DEFAULT NULL COMMENT '更新人',
  `created_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',
  `updated_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '更新时间',
  `is_default` tinyint(4) DEFAULT '0' COMMENT '是否默认枚举，1-是',
  `effective_date` timestamp NULL DEFAULT NULL COMMENT '生效时间',
  `expire_date` timestamp NULL DEFAULT NULL COMMENT '失效时间',
  `remark` varchar(512) DEFAULT NULL COMMENT '备注',
  PRIMARY KEY (`id`),
  KEY `idx_aid_p_code` (`aid`,`p_code`),
  KEY `idx_order_no` (`order_no`),
  KEY `idx_tag_code` (`tag_code`),
  KEY `idx_p_code` (`p_code`)
) ENGINE=InnoDB ；

tidb 集群参数主要有：

server_configs:
  tidb:
    log.level: info
    log.slow-threshold: 300
    mem-quota-query: 10737418240
    performance.txn-entry-size-limit: 125829120
    performance.txn-total-size-limit: 10737418240
    prepared-plan-cache.enabled: true
  tikv:
    raftstore.apply-pool-size: 8
    raftstore.messages-per-tick: 4096
    raftstore.raft-max-inflight-msgs: 2048
    raftstore.store-pool-size: 5
    raftstore.sync-log: false
    readpool.coprocessor.use-unified-pool: true
    readpool.storage.use-unified-pool: true
    readpool.unified.max-thread-count: 12
    rocksdb.defaultcf.force-consistency-checks: false
    rocksdb.lockcf.force-consistency-checks: false
    rocksdb.max-background-jobs: 3
    rocksdb.max-sub-compactions: 2
    rocksdb.raftcf.force-consistency-checks: false
    rocksdb.writecf.force-consistency-checks: false
    server.grpc-concurrency: 8
    storage.block-cache.capacity: 32GB
    storage.block-cache.shared: true

MySQL同步到TiDB集群的表中有自增主键ID，还有3条辅助索引都是递增属性的，上游MySQL批量写入的时候下游 tikv IO 就飙高。这样情况求问怎么处理比较好？

小龙虾爱大龙虾 · 2024 年6 月 20 日 09:06

SSD 不用看 IO Util 指标的，关注磁盘相应时间，IOPS，吞吐量有没有到瓶颈就好了

我是吉米哥 · 2024 年6 月 20 日 14:49

看下磁盘读写延迟，如果延迟超过10ms，就说明磁盘有点慢了

Hacker_小峰 · 2024 年6 月 21 日 10:03

哦哦~响应时间有升高，但是在可接受范围内。谢啦！

Hacker_小峰 · 2024 年6 月 21 日 10:09

TiDB Duration 99线平常 4ms 左右，tikv IO 告警时 Duration 99线 20.9ms ,磁盘是SATA SSD。目前这个时间业务是可以接受的。那看来就是 IO 利用比较充分了，就是收到告警就忧心忡忡。
谢谢大大！

zhaokede · 2024 年6 月 22 日 01:17

m2固态硬盘性能更佳

Hacker_小峰 · 2024 年6 月 24 日 03:09

哈哈，是的！m2固态硬盘性能更佳,一分钱一分性能啊。我们目前对性能要求不高，主要是qiong，用的旧设备，凑合一下咯。

TiDBer_ZxWlj6A1 · 2024 年6 月 24 日 07:18

所以tidb建议上nvme

Hacker_小峰 · 2024 年6 月 25 日 09:19

收到