tikv缩容扩容想要balance快,PD需要配置哪些参数

【 TiDB 使用环境】生产环境
【 TiDB 版本】v4.0.11 4tikv 3pd 16tikv
【复现路径】
【遇到的问题:问题现象及影响】现在想缩容tikv节点,请教下,需要怎么配置pd的参数?
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件:截图/日志/监控】

使用 pd-ctl 执行 config show 命令可以查看所有的调度参数,执行 config set {key} {value} 可以调整对应参数的值。常见调整如下:

  • leader-schedule-limit:控制 Transfer Leader 调度的并发数
  • region-schedule-limit:控制增删 Peer 调度的并发数
  • max-snapshot-count:每个 Store 允许的最大收发 Snapshot 的并发数

还有个最重要的 pd-ctl store limit 调整

在 TiKV 4.0.11 版本中进行缩容或扩容操作时,为了加快 PD(Placement Driver)的 balance 速度,可以调整以下参数2021:

  1. leader-schedule-limit:这个参数用于控制 leader 调度的并发数。扩容时可以适当调高此值,但不能太大,否则可能会影响业务使用。可以调整为 4。
  2. region-schedule-limit:这个参数用于控制 region 调度的并发数。扩容时可以适当调高此值,以加快数据均衡的速度。可以调整为 32。

调整这些参数的方法是使用 PD 控制台命令:

tiup ctl pd -u http://pdip:2379 -i config set leader-schedule-limit 4
tiup ctl pd -u http://pdip:2379 -i config set region-schedule-limit 32

通过pd-ctl config set 命令可以增大leader-schedule-limit、replica-schedule-limit、region-schedule-limit等参数增加leader/region的调度速度,加快下线过程,上述命令是用于控制PD侧调度命令的产生速度,实际的执行还收tikv侧的消费速度限制,通过pd-ctl store limit <store_id> 增加消费速度

调节region调度速度
登录pd-ctl
» config show
» config set leader-schedule-limit 64
» config set replica-schedule-limit 80
store limit // 显示所有 store 添加和删除 peer 的速度上限
store limit all 5 // 设置所有 store 添加和删除 peer 的速度上限为每分钟 5 个
store limit 1 5 // 设置 store 1 添加和删除 peer 的速度上限为每分钟 5 个

1 个赞

优先调整store limit,还可以调整replica-schedule-limit、max-pending-peer-count、max-snapshot-count、leader-schedule-limit,rebalance完成后,记得调回去