br 备份一直卡在checksum很长时间

【 TiDB 使用环境`】生产
【 TiDB 版本】v5.2.0
【遇到的问题】br全备完成一直在checksum
【复现路径】没有
【问题现象及影响】
【附件】


这个图一直在checksum

这个图是备份的日志,也没看到报错,但是总的数据量才288g,没有那么大的数据路,但是checksum在98.95的时候,卡在这里一个小时了,这样的情况正常吗?如果我现在把这个备份进程停掉,可以在目标端恢复数据吗.

在等待了6小时左右之后,终于完成了。

,checksum比备份的时间还长。这是什么原因呢,而且数据量不是很大,这个库只有290g,checksum竟然需要6个小时左右。很无语

  1. 可以看下 BR 的监控,是否某项资源不足。比如 cpu,IO 是否有打满。

检查下资源, 或者有其他地方在调用 ,

根据经验,io瓶颈,之前我有类似的情况

看看监控吧,这个只能盲猜了

1 个赞

每次备份都要checksum很长时间吗

BR 为了保证备份数据的完整性会对数据进行 checksum 计算。

根据现有信息来看,checksum 计算缓慢有以下几种可能:

  1. TiDB 集群中有大量的历史数据,导致读取数据缓慢,可通过 select VARIABLE_NAME, VARIABLE_VALUE from mysql.tidb; 查看 GC 配置,适当减小 tikv_gc_life_time,参见 TiDB 垃圾回收 (GC)
  2. TiKV 节点的 CPU 不支持 PCLMULQDQ 或 SSE 4.1 指令,可通过 cat /proc/cpuinfo 检查。

也可通过添加 --checksum=false 跳过 BR 备份时的 checksum 计算。