TiDB集群昨天变得很慢，重启后，今天研发同事发现少了一批表

Whm412 · 2020 年6 月 12 日 06:49

为提高效率，提问时请提供以下信息，问题描述清晰可优先响应。

Lucien-卢西恩 · 2020 年6 月 12 日 07:43

这个可以看 GC 的相关监控可以确认是否有大量的 delete range 操作以及 TiDB Server 的 SUmmary 面板中的 Statement OPS 监控可以到是否有 DDL语句操作。

可以参考一下 TiDB log 是有记录的。

Lucien-卢西恩 · 2020 年6 月 12 日 07:49

关键词 ”CRUCIAL OPERATION“

Whm412 · 2020 年6 月 12 日 07:54

通过GC的delete range可以发现没有这个处理

按照CRUCIAL OPERATION这个关键词搜索了一下，这些都程序操作的，没有被删除的以kpi_开头的表

Lucien-卢西恩 · 2020 年6 月 12 日 08:02

是不是日志切割了？

Whm412 · 2020 年6 月 12 日 08:03

现在查的是这个日志，昨天的9点多的都在这里面

Lucien-卢西恩 · 2020 年6 月 12 日 08:08

如果有就是类似这样的 log ，或者看看有没有 rename table 操作。

Whm412 · 2020 年6 月 12 日 08:12

拿记录本和直接在服务器上面使用grep都过滤不到以kpi_开头表

Lucien-卢西恩 · 2020 年6 月 12 日 13:05

麻烦发一下 DDL history 记录可以确认是否有删除的操作，操作方法通过 TiDB API 查看 DDL history 记录从定向到 log 中。

# Get all TiDB DDL job history information.

curl http://{TiDBIP}:10080/ddl/history

Whm412 · 2020 年6 月 15 日 02:00

数据导出来了，有712M，使用工具查找了一下，没有匹配的以kpi_开关的表的删除。

来了老弟 · 2020 年6 月 15 日 02:27

你好，

请提供下楼上的需要的排查信息。

curl http://{TiDBIP}:10080/ddl/history