- TiKV 的分成设计中最上层封装了各种 RPC 请求类型(kv_get, kv_batch_get, batch_commands, prewrite, coprocessor …)
- [kv.rs:1023] [“kv rpc failed”] [err=RemoteStopped] 这个抛错应该是 TiDB 那边有发 batch_commands 类型的 SQL 正常 或 异常 终止请求的过程中, tikv 侧的的 rpc request 日志
- 当然不止 tidb 会发请求, 其他工具 BR 等都有可能, 不过 大量 应该还是 tidb 的可能性比较大
2 个赞
我在tidb5.4.3版本也遇到这种 [“kv rpc failed”] [err=RemoteStopped] 的报错。还存在transport full的报错,多次后tikv实例就hang死了。日志也不再打印。tiup cluster display显示该实例状态为disconnected。
发生场景也是在扩容了一个kv实例,新增kv实例与老kv实例之间存储尺寸使用有很大差异,均衡过程中。
这么频繁的告警,感觉不是应用导致。
region数量很多吗