在执行explain analyze table时的执行！tot_proc时间很长！

zyw8136 · 2020 年11 月 9 日 08:07

为提高效率，提问时请提供以下信息，问题描述清晰可优先响应。

【TiDB 版本】：TiDB4.0.8
【问题描述】：
单表查询，做了部分聚合，时间跨度3个月，数据在3000W，KV 取数据在几百毫秒，主要耗时在TiDB上。

image1518×391 25.4 KB

image1515×339 17.5 KB

这样怎么优化？
这个时间有点长，tot_proc时间代表什么意思？

若提问为性能优化、故障排查类问题，请下载脚本运行。终端输出打印结果，请务必全选并复制粘贴上传。

yilong · 2020 年11 月 9 日 10:47

麻烦把完整的 explain analayze sql 都发出来，多谢。

zyw8136 · 2020 年11 月 9 日 12:08

EXPLAIN ANALYZE SELECT
url,
title,
adduser,
sum(pv) AS top_total_click_count
FROM
biz_cms_flow
WHERE
dn = ‘acc’
AND dt >= ‘20200701’
AND dt <= ‘20201105’
AND addtime >= ‘20200701’
AND addtime <= ‘20201105’
GROUP BY
url,
title,
adduser
ORDER BY
sum(pv) DESC
LIMIT
100;

yilong · 2020 年11 月 10 日 02:20

把完整信息发一下，类似这样

zyw8136 · 2020 年11 月 10 日 03:54

yilong · 2020 年11 月 10 日 06:26

这个参数调大试试 https://docs.pingcap.com/zh/tidb/stable/system-variables#tidb_index_lookup_concurrency

zyw8136 · 2020 年11 月 10 日 08:03

在发帖之前，我已经把这个数据扩大了一倍（默认是4，我现在设置成了8），还是这样的效果！

crazycs520-PingCAP · 2020 年11 月 10 日 08:22

@zyw8136 调到下面2个参数再试试？

set @@tidb_index_lookup_concurrency=16;
set @@tidb_distsql_scan_concurrency=40;

crazycs520-PingCAP · 2020 年11 月 10 日 08:26

如果需要经常跑这个聚合查询，而且查询的条件基本不变的话，可以考虑开启 cop cache 配置, https://docs.pingcap.com/zh/tidb/stable/tidb-configuration-file#tikv-clientcopr-cache-从-v400-版本开始引入

zyw8136 · 2020 年11 月 10 日 10:55

还是设置了还是不行。

这块就的统计条件就需要查询一次，一般出了结果就不查第二次了，所以缓存没有效果。

crazycs520-PingCAP · 2020 年11 月 11 日 02:38

@zyw8136

可以重新贴下参数调整后，explain analyze 的结果吗？

tot_proc 是所有在 TiKV 侧的 cop process time 总时间。

现在主要耗时在 indexlookup 算子, 先读索引，然后还要回表。

zyw8136 · 2020 年11 月 11 日 06:26

crazycs520-PingCAP · 2020 年11 月 11 日 07:52

set @@tidb_distsql_scan_concurrency=40; 后，再继续调大 tidb_index_lookup_concurrency 看看有没有效果，比如调到 100？

crazycs520-PingCAP · 2020 年11 月 11 日 08:34

@zyw8136 另外可以对这个表执行下 analyze 吗？这个表大概有多少行？如果不是特别大的话，现在的执行计划走 indexLookUp 并不优。

zyw8136 · 2020 年11 月 11 日 09:06

到了100后，tot_proc 还是那么长时间（20多秒）。还是没有效果。

zyw8136 · 2020 年11 月 11 日 09:07

analyze表的话，还是一样的效果，这个表大概7000多万的数据。不是特别大。

crazycs520-PingCAP · 2020 年11 月 11 日 09:36

@zyw8136 可以加 hint, 不走索引，强制走全表扫吗？感觉总共 7000W 数据，读 3000W 数据可能走全表扫可能更好。

EXPLAIN SELECT
url,
title,
adduser,
sum(pv) AS top_total_click_count
FROM
biz_cms_flow ignore index (xxxx)
....

zyw8136 · 2020 年11 月 11 日 11:38

不用索引了，比原先的时间少了一半，20多秒了，但是，感觉这么点数据，应该不会这么长时间。

yilong · 2020 年11 月 12 日 06:37

从执行计划看 tikv 侧取数据 sum 数据不到1s，但是传给 tidb-server 花费了很长时间， rpc 时间非常长，感觉是网络带宽的问题，请检查下，tidb-server 到每个 tikv 的网络是否正常，多谢。