- 网络层异常
- 跨节点通信延迟:TiDB Server 与 TiKV/PD 节点之间的 TCP 包往返时间(RTT)超过默认的 2 秒阈值(可通过
tidb_tikvclient_timeout
参数调整) - 网络分区风险:物理交换机故障导致部分节点间通信中断,触发 gRPC 连接重试机制失败
- MTU 配置冲突:当节点间 MTU 值不一致时,大数据包分片可能导致传输异常
- 服务端负载瓶颈
- TiKV 线程阻塞:Scheduler 工作线程满负荷(
scheduler-worker-pool-size
默认 4),表现为server is busy
错误 - PD 路由延迟:Region 元信息同步延迟超过客户端等待时间,触发
region is unavailable
告警 - 存储引擎压力:TiKV 实例的 RocksDB compaction 积压,导致 LSM-tree 查询路径延长
- 配置参数异常
- 会话级超时设置:
max-execution-time
参数值过低导致查询被强制终止 - 事务重试机制:
tidb_disable_txn_auto_retry=on
时,网络抖动易引发事务提交失败 - 连接池限制:
connPoolSize
配置不足导致连接等待队列堆积
max-execution-time和tidb_disable_txn_auto_retry=on 和connPoolSize我在客户端并未检索到该参数的配置
https://docs.pingcap.com/zh/tidb/stable/system-variables/#max_execution_time
https://docs.pingcap.com/zh/tidb/stable/system-variables/#tidb_disable_txn_auto_retry
这都是tidb的啊
这图你们都是怎么看的,我点不开,直接把链接复制出来,打开图糊的没法看了。
有文本的嘛?让我也看看啥内容。