RawKV 的 TiKV 该如何备份

采用的RawKV+PD+TiKV,现阶段想对TiKV进行迁移测试,本来想通过BR来做的,官方文档说BR针对RawKV还在测试阶段。
想详细了解下此种集群下的TiKV该如何备份?

如果要对TiKV进行迁移的话,想保留原集群的前提下又有哪些方案呢?

Hi @TiDBer_Kd70keFy,目前的 BR 虽然支持了备份 RawKV 数据,但功能还未完全支持尽在有限的场景下使用,可以先通过应用双写进行热备。

我们同时正在重构 BR 支持 TiKV 的备份恢复,相关工作可以在这里 track:https://github.com/tikv/migration/issues/67

另外方便描述下您的备份场景和其中的要求吗,比如:

  • 期望整库还是部分数据的备份
  • 采用什么样的周期进行备份
  • 备份的数据量大概有多大(单位:字节)
  • 期望备份成什么文件或备份到哪些平台上(例如本地文件或者 S3 协议的对象存储服务)
  • 期望整库还是部分数据的备份
    测试希望整库备份以用于TiKV迁移
  • 采用什么样的周期进行备份
    不知道备份会不会对生产造成业务压力以及性能争用,待有相关的资料经过测试验证后再决定采用什么样的备份策略。因为TiKV本身就是高可用,多副本的,安全性有保障,备份作为保障策略周期可能会比较长。
  • 备份的数据量大概有多大(单位:字节)
    测试环境没有太多数据 300G左右,生产会比较多。25~35T
  • 期望备份成什么文件或备份到哪些平台上(例如本地文件或者 S3 协议的对象存储服务)
    如果备份能支持SST格式的话也可以,后期会考虑使用华为云的OBS,类似于阿里云的s3.

谢谢解答,双写需要另外搭建一套TiKV集群,成本消耗大。

还是想咨询一下,你给的link里面的task显示已经supportRawKV API V2, 是不是表示BR已经可以支持RawKV了?

@TiDBer_Kd70keFy 现在的 BR 的确可以在 5.0 及以上的 TiKV 上进行备份恢复。但因为没有经过充分的测试,可能会有非预期的问题。

我们正在进行的工作是支持 API v2,有了它,我们可以实现 TiKV 集群的 CDC 功能,同一套集群的 RawKV 和 TxnKV 数据也能混合存储和读写。但因为 API v2 修改了底层的数据编码格式,如果是 RawKV 用户,从老集群升级到新集群需要停机,用新版本的 BR 备份恢复到新集群上。

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。