tidb 的监控显示,从 1 号的 18 点后,开始 store-1 的 duration 逐渐升高,并且到 22 点左右下降,于此同时 coprocessor 类型的请求 duration 也逐渐升高,且趋势较为吻合:
tikv-details 的 coprocessor 的相关监控,再次佐证了这个推测:
基于上述现象,建议你那里看下这个时间段的相关信息:
-
看下 store1 的 TiKV-Details 在相同时间段和其他 store 的差异
-
看下 tikv-details 的 Total RocksDB Perf Statistics 每个 store 的情况是否有非常大的差异,需要修改公式参考:
-
看下 tikv-details → RocksDB kv 下的 read flow by store instance 的情况是否有非常大的差异,需要修改公式参考:
另外,当前版本为 v3.0.11,非常低,建议在测试环境充分测试后,升级集群版本,4.0 版本有了 tidb dashboard ,对 slowlog 的查看,集群各个组件日志的检索非常便捷,升级相关的帖子参考: