tidb v4.0.2 监控显示TCP Retrans 90%以上是什么原因?

请问v 4.0.2 TCP Retrans 90%以上是什么原因(此三台服务器跑的是 tidb server + pd),要如何排查?
image

观察 node_exporter 监控页面上的 tcp retrans 相关信息,看是不是网络有丢包

网络没有丢外

找个时间区间,看下 tidb log 和 tikv log,可以上传下附件。
另外提供下 tidb 的版本
selct tidb_version();

image

日志太大了,100多M,压缩也不给上传

https://pan.baidu.com/s/1WmfL3ukeNeIyewpawDHtNw 提取密码:0466

下面百度云盘URL是你要的日志,太大了, 只能上传到云盘

TiDB 日志未发现丢包异常等报错,建议再检查下 Retrans 指标升高时的系统日志和 dmesg 日志,比如是否可能存在网卡相关的报错。

此外 TiDB 日志发现疑似有索引不一致的 ERROR

[2020/07/30 14:22:06.617 +08:00] [ERROR] [distsql.go:952] ["inconsistent index handles"] [index=tbl] [index_cnt=230] [table_cnt=0] [missing_handles="[

建议对报错的信息 index 所在表执行 admin check table <TableName> ,如果检查失败,则先通过命令关闭 GC,然后报 bug

begin;
update mysql.tidb set variable_value='72h' where variable_name='tikv_gc_life_time';
commit;

对于不一致的行为 ,可以先执行 admin recover index [table_name] [index_name]; 进行修复。