TiDB集群真实大小

如何查看TiDB集群数据的真实大小

【 TiDB 使用环境】线上
【 TiDB 版本】5.0.6
【遇到的问题】 对监控的大小有疑问
【复现路径】做过哪些操作出现的问题
【问题现象及影响】
监控显示52T

但是查询information_schema

数据相差太大

【附件】

请提供各个组件的 version 信息,如 cdc/tikv,可通过执行 cdc version/tikv-server --version 获取。

information_schema.tables里的不准确,系统结构导致,而且还有3副本

那怎么能查到真实数据大小么,现在感觉差太多了

监控数据就是集群的大小,3副本的,你看下data目录下是否有很多log文件,placehoder文件大小,snap目录大小。还有raftdb目录大小

image
就是db目录2.7T

17个TiKV

52.2TB,这个基本上准的,可以把所有tikv节点数据目录大小加起来验证下。

但是业务每个库的真实大小 业务方都说没那么大,请问有字典表能查哪个库真实大小么?

现在就是要排查哪个库表占用最大的问题,可能有些不必要的数据需要清理

现在就是要排查哪个库表占用最大的问题,可能有些不必要的数据需要清理1

提供一个建议可以试试,单个表用information_schema.tables 里的数据量大小除以information_schema.tables里的行数,然后乘以表的真时数据量

现在就是看到的infor_schema.tables所有表大小加起来 远远小于监控的大小,不知道为啥

字典表只能预估,不精确
https://docs.pingcap.com/zh/tidb/stable/manage-cluster-faq#如何预估-tidb-中一张表的大小

我也按照这个查询了,还是和52.2T对不上,还有NULL的情况不知道是什么?

总共20T,NULL占了15T,但是监控52.2T

看那些表大还是安统计因为行数排序下找把。按表大小找不到

information_schema.tables是基于统计信息的,如果统计信息是新的,应该就是对象的实际大小

现在查到最大的库也就不到1.6T 加起来不到20T 就很奇怪空间被什么占用了

现在查到最大的库也就不到1.6T 加起来不到20T 就不知道是被什么占用了空间

GC 时间设置多久,select * from mysql.tidb。DB目录2.7T,目录下的placeholder文件、snap目录、raftdb目录、log文件占了多少?