试试下面这个?
从 v8.0.0 起,
br
命令行工具新增--tikv-max-restore-concurrency
参数,用于控制每个 TiKV 节点的最大 download 和 ingest 文件数量。此外,通过调整此参数,可以控制作业队列的最大长度(作业队列的最大长度 = 32 * TiKV 节点数量 *--tikv-max-restore-concurrency
),进而控制 BR 节点的内存消耗。通常情况下,--tikv-max-restore-concurrency
会根据集群配置自动调整,无需手动设置。如果通过 Grafana 中的 TiKV-Details > Backup & Import > Import RPC count 监控指标发现 download 文件数量长时间接近于 0,而 ingest 文件数量一直处于上限时,说明 ingest 文件任务存在堆积,并且作业队列已达到最大长度。此时,可以采取以下措施来缓解任务堆积问题:
- 设置
--ratelimit
参数来限制下载速度,以确保 ingest 文件任务有足够的资源。例如,当任意 TiKV 节点的硬盘吞吐量为x MiB/s
且下载备份文件的网络带宽大于x/2 MiB/s
,可以设置参数--ratelimit x/2
。如果任意 TiKV 节点的硬盘吞吐量为x MiB/s
且下载备份文件的网络带宽小于或等于x/2 MiB/s
,可以不设置参数--ratelimit
。
- 调高
--tikv-max-restore-concurrency
来增加作业队列的最大长度。