tidb_server 随机不定时自动重启

JOJO_DB · 2024 年8 月 16 日 07:52

【 TiDB 使用环境】生产环境
【 TiDB 版本】v5.30
【复现路径】暂无
【遇到的问题：问题现象及影响】
【资源配置】进入到 TiDB Dashboard -集群信息 (Cluster Info) -主机(Hosts) 截图此页面
【附件：截图/日志/监控】
tidb server自动重启、检查log后发现以下报错、已经持续半个月了，随机性的再不同节点上出现。

检查发现每次出现问题都会有以下SQL语句。不太清楚具体是什么原因造成的。

select HlGH_PRlORITY table_id, is_index, hist_id, count, repeats, lower bound, upper_bound, ndv from mysql.stats_buckets order by table_id, is_index, hist_id, bucket_id;

tidb菜鸟一只 · 2024 年8 月 16 日 08:06

先看下有没有触发oom吧https://docs.pingcap.com/zh/tidb/v5.4/tidb-troubleshooting-map#32-oom-问题

Kongdom · 2024 年8 月 16 日 08:49

随机重启不同节点？看看节点重启前的内存使用，如果特别大就是有OOM了，检查一下OOM日志吧。

JOJO_DB · 2024 年8 月 16 日 09:15

监控那边查过~内存、cpu负载都不高、还很低。而且几乎都是非生产时间出现的问题。

Kongdom · 2024 年8 月 16 日 09:18

难道是自动analyze导致的？表健康度怎么样？

JOJO_DB · 2024 年8 月 16 日 09:19

这边都检查过~没有发现过异常不过tidb.log里有这些错误。

JOJO_DB · 2024 年8 月 16 日 09:20

业务不复杂~一百张表多点。

Kongdom · 2024 年8 月 16 日 09:22

看截图的第一条日志，是在删用户么？

Kongdom · 2024 年8 月 16 日 09:27

有位遇到类似的同学，但是直接升级解决，没有找到最终问题。

JOJO_DB · 2024 年8 月 16 日 09:30

这个时间段没人操作、不是人为执行的。而且上面除了监控其他啥都没了。

JOJO_DB · 2024 年8 月 16 日 09:33

谢谢~我看了下这个帖子。感觉是非常的像。看来也只能升级了。

Kongdom · 2024 年8 月 16 日 09:37

出现这个问题之前，服务器配置上有调整么？感觉不应该无缘无故就出现问题。

TiDBer_xTvoCh2f · 2024 年8 月 16 日 10:14

终极大法

FutureDB · 2024 年8 月 18 日 07:52

升级之后还有出现重启了吗

EDG-给我冲 · 2024 年8 月 22 日 02:47

直接升级6.5！！！

lemonade010 · 2024 年8 月 22 日 05:44

我记得Oracle 好像有一个这样的问题,改一下系统参数,