bug12934: [Critical bug] 切换 PD Leader 或重启 PD 可能导致 SQL 执行持续报错
产品 | TiDB |
---|---|
组件 | PD TiKV |
版本 | 5.4.2 5.3.2 |
分类 | Troubleshoot |
标签 | KnowIssue |
来源 |
Issue
在对 PD 进行 Transfer Leader 或重启操作后,集群出现 SQL 执行持续报错的现象。
6.2.0 测试中发现了该问题:https://github.com/tikv/tikv/issues/12934
受到该 bug 影响的版本:v5.3.2, v5.4.2
Diagnostic Steps
-
TiDB 监控观察到 SQL 执行持续报错,报错为 Region Unavailable / Region Epoch not match 等
-
TiKV 监控中 TiKV Details - PD - PD heartbeats 中观察到持续快速上涨的 pending
Resolution
升级 TiKV 至修复了该 Bug 的版本。
Bug Fix PR: https://github.com/tikv/tikv/pull/13094
预期修复版本:v5.3.3, v5.4.3