TiDB 的问答社区

同一条SQL，执行时间差异较大

🪐 TiDB 技术问题性能调优

Hacker_pkogXYY3 (Hacker Pkog Xyy3) 2020 年11 月 21 日 10:30 1

TIDB版本信息：
version
explain analyze信息：

explain_analyze1

slow query log 信息：

tiadb dashboard 信息：

现象描述：正常情况下查询时间毫秒级。但是最近平均每20次就会出现一次特别长时间的查询，整个TIDB所有的表都会出现这种请款。

集群配置：
1 PD 2* 8核CPU 内存 16G SAS硬盘
1 TIDB 2* 8核CPU 内存 16G SAS硬盘
3 TIKV 2* 8核CPU 内存 32G 2TSSD

网络环境:千兆网络,内网。会有不稳定，基本在 0.1 -30 ms 之间波动

监控信息如下：

表数据量在一亿左右， hphm 字段有索引。及时不适用 * 来查询，适用正常的指定字段查询还是会出现特别长的查询时间

spc_monkey (carry@pingcap.com) 2020 年11 月 22 日 03:42 2

1、给一下 overview 下的 system info 监控指标
2、查看 tidb 下的 kv duration 、tikv-detail下的 thread cpu、raft-kv 下的指标，还有 task 下的监控指标

Hacker_pkogXYY3 (Hacker Pkog Xyy3) 2020 年11 月 22 日 06:59 3

overview面板信息

tidb-kv duration 这个信息我不知道指的具体是哪个，下面是我猜的

tikv-detailsx下的 threadcpu

raft-kv这个信息也不知道具体是哪个，没有找到标签

task信息

下面将 tidb 和tikvdetails 面板页截图供参考选择

Hacker_pkogXYY3 (Hacker Pkog Xyy3) 2020 年11 月 22 日 07:01 4

以上所截取的面板信息，都是那条sql发生时间段内半小时的面板情况

spc_monkey (carry@pingcap.com) 2020 年11 月 22 日 10:53 5

监控看起来集群压力很小，数据库内部执行速度也比较快，不过 tidb-server 下的 kv duration 比较长，所以需要看看 tikv-detail 下的 grpc 下的 grpc duration 是否高，如果不高，则需要看看各服务器之间的网络问题（blackbox—exporter 下看），重点排查一下网络吧，grpc duration 信息补充一下，

Hacker_pkogXYY3 (Hacker Pkog Xyy3) 2020 年11 月 22 日 11:08 6

补充grpc 信息，问题语句发生时间是12:53左右，确实发现grpc duration一下子飙升，锁冲突比较多？

、

spc_monkey (carry@pingcap.com) 2020 年11 月 23 日 02:15 7

再提供一下
1、tikv-detail 下的 coprocessor detail 及 coprocessor overview 下的所有指标，还有 rocksdb-kv 下的所有监控指标（如果太大，可百度网盘）
2、检查 tidb-server 与 tikv-server 之间的网络，看监控 blackbox——exporter

spc_monkey (carry@pingcap.com) 2020 年11 月 23 日 08:04 8

麻烦再给一下这个监控指标：TiKV-Detail -> Coprocessor Overview -> Total Response Size**

©2023 TiDB Community. 京ICP备20022552号-5 京公网安备11010802043344号