想咨询TiDB数据库在使用中发现的问题

【 TiDB 使用环境】
【概述】:场景 + 问题概述
【背景】:做过哪些操作
【现象】:业务和数据库现象
【问题】:当前遇到的问题
【业务影响】:
【TiDB 版本】:V5.3.0

1,第一个问题,我们当初部署TiDB集群的时候,生产环境部署在亚马逊AWS云平台上,
总共6台服务器,其中3台TiKV服务器都在A可用区,1台grafana监控服务器也在A可用区,剩下的2台服务器TiDB + PD服务共同部署在B可用区,
这种架构部署后,这两台服务器一个月产生的跨区流量高达130000GB流量,产生了一笔1300美元的流量费用,这个流量是否正常,配置是否需要进一步优化?我们现在已经把这两台跨区的服务器退订了,都改成了相同的A可用区。

2,第二个问题,我们在2021年4月份部署过CDC服务,想把生产环境TiDB集群数据实时同步到另外一台MySQL里面作为热备,来解决机房不稳定的问题,当时我们部署的CDC服务器在亚马逊AWS里面,c5.4xlarge,CPU是16核,内存32G,除了部署了CDC服务器,同时还部署了TiDB + PD服务,当时的TiDB版本是V4.0.9,启动CDC服务时出现了fatal error: runtime: out of memory,https://asktug.com/t/topic/69509/4,

当时发的工单给出的回复和建议是:
a. TiCDC服务器升级配置,由原来的32G升级到64G。
b. 升级TiDB版本至最新版本,并启用磁盘SSD。

我们现在TiDB集群版本已经升级到最新的V5.3.0版本,第二个问题想问下,如果要启用CDC数据同步服务,服务器是使用两台分别CPU是16核,内存32G,还是使用一台32核,内存64G的服务器呢?

1 个赞

1、 每个事务都需要向pd请求start-tso/commit_tso会消耗流量,pd和tikv的心跳会消耗流量,pd的调度或之间同步也消耗流量。tikv间raft消息复制也消耗大量流量。 可以考虑:1. 开启tikv的压缩传输 2. pd 都部署在A区(pd可以恢复重建,需记录cluster-id,alloc-id),设置leader 在A区,B区设置1-2副本。这样就是仅一个区能提供服务,历史数据读取通过stale read方式也可以使用B 区


2. 仅1台cdc的话没有高可用了,不能切换。另外32G内存是否足够还需要测试下。

2 个赞

好的,了解,感谢

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。