tiflash 副本不可用,同步数据进度为0

好的,稍等

感谢!
日志内容较多,我仅保留了今天的,您看可够排查的,如果缺少了我再上传哈.

pd.log (589.0 KB) tiflash.log (1.8 MB) tiflash_cluster_manager.log (556.4 KB) tiflash_tikv.log (257.5 KB) tikv.log (1.1 MB) tikv.log.2021-01-04-13:05:21.828285573 (3.9 MB)

感谢!我们先就这部分日志进行排查。

[WARN] [raft_client.rs:199] ["send to 10.248.228.18:20170 fail, the gRPC connection could be broken"]
似乎这个 TiKV 节点与 TiFlash 节点之间的连接有问题,确认下是否有防火墙之类的网络策略,用 telnet 等工具确认下网络连通性?

啊 看了一下这个端口 20170 确实不通,我来处理一下…

可是为啥有很多表同步成功了呢?是否还有别的问题?

从这个回复的截图来看,同步成功的 Region ,其 Leader 的 store_id 均不为 1。所以推测是只有部分TiKV与TiFlash之间的连接不通。

如果一个表的数据对应 Region 的 leader ,都位于与 TiFlash 网络连接通畅的 TiKV 节点上,那么其中的数据可以正常同步到TiFlash。所以表现为部分数据能同步成功的情况。

1 个赞

可以等网络连通性问题解决后,再观察有无其他异常。

哦哦 我明白了。感谢老师指导。
这个排查思路我好好整理一下,非常感谢!

请问现在问题的 KV 跟 TiFlash 的同步正常了吗?

前天老师指导之后同步正常了。

昨天我测试了一种情况,drop 表,重新通过 dm 从上游同步数据到 tidb,然后再次设置 tiflash 同步,目前看起来又不正常了,我再按老师指导的步骤排查一下,有结果再同步

感谢

是因为一个 KV 跟 TiFlash 之间网络不同的问题吗?

是的呢,目前同步已经正常了。
非常感谢!!

好的 有其他问题欢迎反馈。

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。