请问v 4.0.2 TCP Retrans 90%以上是什么原因(此三台服务器跑的是 tidb server + pd),要如何排查?
观察 node_exporter 监控页面上的 tcp retrans 相关信息,看是不是网络有丢包
网络没有丢外
找个时间区间,看下 tidb log 和 tikv log,可以上传下附件。
另外提供下 tidb 的版本
selct tidb_version();
日志太大了,100多M,压缩也不给上传
下面百度云盘URL是你要的日志,太大了, 只能上传到云盘
TiDB 日志未发现丢包异常等报错,建议再检查下 Retrans 指标升高时的系统日志和 dmesg 日志,比如是否可能存在网卡相关的报错。
此外 TiDB 日志发现疑似有索引不一致的 ERROR
[2020/07/30 14:22:06.617 +08:00] [ERROR] [distsql.go:952] ["inconsistent index handles"] [index=tbl] [index_cnt=230] [table_cnt=0] [missing_handles="[
建议对报错的信息 index 所在表执行 admin check table <TableName>
,如果检查失败,则先通过命令关闭 GC,然后报 bug
begin;
update mysql.tidb set variable_value='72h' where variable_name='tikv_gc_life_time';
commit;
对于不一致的行为 ,可以先执行 admin recover index [table_name] [index_name];
进行修复。