同样的查询在不同的tidb server节点上查询时间差异很大

重启试试 · 2023 年7 月 19 日 01:46

【 TiDB 使用环境】生产环境
【 TiDB 版本】6.5.2
【复现路径】做过哪些操作出现的问题
【遇到的问题：问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件：截图/日志/监控】

目前是3台物理机上各部署了一个tidb、一个pd、一个tikv

资源配置信息

实例信息

当前节点查询比另外两个节点慢很多

查了执行计划也是一样的，请问这个应该怎么跟着排查和定位问题

h5n1 · 2023 年7 月 19 日 01:49

不同节点的explain analyze、 trace 结果看看

caiyfc · 2023 年7 月 19 日 01:52

需要看真实的执行计划，如果201是第一次执行，可能结果被缓存了，然后202和203执行，就直接从缓存里面查询，所以快很多。explain analyze显示的执行计划里面有缓存命中率的，可以检查一下

我是咖啡哥 · 2023 年7 月 19 日 01:55

多次执行的结果吗？
再看看这个表对应的leader region分布？

重启试试 · 2023 年7 月 19 日 02:05

trace结果

重启试试 · 2023 年7 月 19 日 02:06

执行很多次不分先后顺序。201就是比202 203节点慢很多

重启试试 · 2023 年7 月 19 日 02:10

是的，执行很多次结果都一样

h5n1 · 2023 年7 月 19 日 02:13

看trace 201的解析时间要多，看explain analyze 201的indexlookup算子时间长，2个结果时间差异还比较大。这几个节点的硬件配置都一样吧，型号类型有没有numa绑定，cpu节能模式是不都关掉了。

重启试试 · 2023 年7 月 19 日 02:28

硬件配置是一样的，型号类型有没有numa绑定这些也是一样的，cpu节能模式的状态怎么查看的

redgame · 2023 年7 月 19 日 02:41

慢的那个跨节点查询了吧

h5n1 · 2023 年7 月 19 日 03:07

重启试试 · 2023 年7 月 19 日 04:01

三台机器都是 performance

zhanggame1 · 2023 年7 月 19 日 04:58

重启下慢的tidb试试？

h5n1 · 2023 年7 月 19 日 06:16

现在的集群版本是升级上来的吗？

重启试试 · 2023 年7 月 19 日 06:18

重启慢的那个TiDB server节点的意思吗

重启试试 · 2023 年7 月 19 日 06:19

是的从 5的版本升级上来的

h5n1 · 2023 年7 月 19 日 06:22

select version(); 看下每个tidb的版本

重启试试 · 2023 年7 月 19 日 06:26

3个tidbserver上的结果一样

h5n1 · 2023 年7 月 19 日 06:29

对比下3个tidb的变量(show variables ) 和参数差异(information_schema.CLUSTER_CONFIG type=‘tidb’)

重启试试 · 2023 年7 月 19 日 06:55

除了hostname ip这种信息以外其他的都一样