慢查SQL来源 账号和主机异常

【 TiDB 使用环境】生产环境
【 TiDB 版本】7.1.4
【复现路径】
【遇到的问题:问题现象及影响】

从慢查日志和dashboard的慢查SQL中都看到如图的记录,
SQL语句是在执行analyze 操作,来源是从 “192.168.3.108” 的一个主机来源,这个主机只环境中个人测试机,
1、确认没有执行过任何analyze的操作;
2、在3.108主机上通过 tcpdump host 192.168.1.32 -i eth0 抓包也没有任何连接和数据流(其中 1.32是tidb-server主机IP)
3、从dashboard中看到连接的tidb 主机是 “192.168.1.32:10081” ,但是业务对外使用的都是 4001(4001对应的10081)

另外确实有个 dm集群从MySQL同步数据到该集群,但是dm-worker 是另外一个主机不是 3.108 ,但是问题所在的SQL语句确实是和DM 同步有关系的,同步的任务名称就是 “rds-to-tidb-for-product_a1” 当前同步任务的unit 就是 sync。

请问这个是什么情况?

【资源配置】

SQL可以点击进去查询详情

确定不是集群中的服务器吗,因为数据库自身也会发起这个操作的

确定不是tidb集群中的各角色的主机,也和dm 集群没有关系。就是一台个人主机。有时候执行SQL查询确实会从这个主机上操作,但是确定没有执行过 图中出现的特殊SQL

如果是数据库自身发起这个操作的话,是那个组件发起的呢?

TiDB Server


显示这个用户执行的

  1. 首先这个analyze SQL是内部自动进行统计信息更新的语句,也执行成功了。
  2. 由于是系统自动执行的,所以用的是内部端口,没有用对外的4001端口。
  3. 可以通过tiup cluster display 就可以查看到到集群的机器拓扑,对比一下就可以看到这台机器是不是在集群内了。
2 个赞

有点看不懂啊

应该就是那台机器发起的analyze,再仔细排查下

这是tidb集群信息

这是dm 集群信息

所以这两个集群都没有关于 3.108 这个主机, 3.108只是个人使用,且确认没有从该主机发起过analyze sql
1、如大家所言 analyze 是 tidb server 自身发起
2、3.108上面tcpdump 抓包也确实没有到 该 tidb集群的数据流,

所以才有该问题,

1 个赞

有点复杂

从慢查来源看是的,但是问题就是从该主机没有发起过该操作,抓包也没有抓到。所以才奇怪呢

查下tidb的日志和历史日志,自动发起的analy有打印日志的
有根据ratio的比例执行auto analyze triggered和auto analyze for unanalyzed indexes索引的自动日志,你看看时间上是否符合你收集这个analy

192.168.3.108是通过类似navicat登录过tidb server 执行了语句,如果是的话,可以检查下工具的历史命令记录,看看是不是有执行过analyze table的命令,一些工具在登录的时候,会自动执行一些语句,不过大部分都是查询类的就是了

没有呢,这个就是一台kvm虚拟机,平时会用mysql 客户端命令连接各个数据库做一些基本查询。而且这个 analyze sql 是一直再出现,并不是历史过去某个点只出现过几次的问题,是发现不停地有。

select * from INFORMATION_SCHEMA.ANALYZE_STATUS 看下
JOB_INFO: analyze table all columns with 256 buckets, 500 topn, 0.026226043701171875 samplerate 这种是手动
JOB_INFO: auto analyze table all columns with 256 buckets, 500 topn, 1 samplerate

这里也记录了auto analyze

1、在 16:35的时候关闭主机 192.168.3.108
16:43的时候 ping 这个主机已经无法联通

2、在tidb dashboard中依然可以看到来自 3.108的该类查询

3、同步的在 tidb 中查询 information_schema.analyze_status 表中有“对应时间点”的“相关SQL” ,是属于系统自身行为

所以怎么感觉是 7.1.4版本的Bug的么?之前6.1.0和7.1.0的时候没有注意过这个点。不确认那会有没有

表中的都是auto analyze 的记录, 都是tidb server自身发起的。但是表中出现的时间节点和”异常“的链接时间点是对得上的。

而且目前3.108都关机了,还有来自这个主机的连接

1 个赞

感觉就是anto analyze,不过地址显示的可能不对,然后显示的是一个已经不存在的地址,就让人感觉困惑,应该是个bug。

都核对的上是auto analyze,那应该就是bug了