从日志来看,TiFlash 在以下时刻发生了重启。也就是说 TiFlash 是被关掉的。
[2024/08/29 14:11:38.660 +08:00] [INFO] [lib.rs:55] [“Welcome To RaftStore Proxy”]
从 tiup 报错来看,TiFlash 在重启后,在 600s 内还不能够服务。这也不是重启失败所致,而是因为 TiFlash 在重启后需要追赶进度。例如,如果集群写入负载较大,或者重启前 TiFlash 就进度落后,或者 TiFlash 上 Region 很多,那么在重启后,TiFlash 会花费较长时间向 TiKV 追最新的数据,在这段时间中,因为数据依旧落后,是无法提供服务的,也就是 tiup 给到的错误。
所以这个问题实际上是第一次重启后,TiFlash 需要花费较长时间来 restore 和追数据导致的。你第二次手动重启能快速恢复,也是因为数据已经追上的缘故。正如你后续看到集群处于 Up 状态,实际上是已经重启过的。