监控告警提示PD和Tikv low space.
请问PD和Tikv空间使用率如何监控,如何扩容呢?
这两个告警都是指 tikv low space。
扩容:https://docs.pingcap.com/zh/tidb/stable/scale-tidb-using-tiup#扩容-tidbpdtikv-节点
请问tikv low space 是指什么意思呢? 是指节点数量不够,还是指节点空间使用率不够了呢?
目前PD, KV 都是安装在3台机器上,全部安装在这3台机器上,没有单独分开。
这个怎么查呢? 怎么扩大空间呢? 这个是像数据库的表空间一样概念吗?
按照这个扩容。就是 tikv data 目录用的太多了。
我有点不理解,请问这个扩容不是扩容节点吗? data目录不是本地磁盘空间吗? 只要本地磁盘空间够大,怎么会出现low space? 扩容节点不是扩容数据空间吧? 节点的数量和这个low space有关吗?
一个low一个high,指的是 当空间达到这个值之后,当有新数据的时候会优先去存储到没有达到这个值的tikv服务器,不会放在这个达到警戒线的tikv服务器了。
这个监控值是tikv服务器本地存储的物理磁盘空间,要根据实际大小。比如1T的tikv存储分区85%到low警戒线了。还有150G,150G按照你的业务可以用1年多。那就没必要,可以修改值为90或者95.达到这个值之后再扩容tikv,
通过扩容tikv服务器,他会把其他tikv服务器的存储空间分一部分到新的ikv服务器,平均一下。然后这些原来的服务器的空间使用率就降低了
你说这个也是可以,
- 你的data目录是tikv的存储目录,那只要这个分区够大,他肯定不会达到警戒线,不会告警的,
你这个告警肯定是磁盘使用率达到了85% - PD 不会存储数据,如果慢了,就检查一下是不是日志过多或者其他文件,一般来说200G空间用10年都不会有问题
3.扩容节点一般指的是tikv服务器的存储空间不够用了,分区没法库容,只能通过增加服务器,来平衡其他服务器的存储空间,达到降低存储使用率,
4.节点数量和low space 也有关系。比如你只有1台tikv 100G存储,你是用来90G,就会提示存储时会用率告警,如果你扩容一台tikv 100G,那他就会平均一下。每台都是45G。那就不会告警了
本地扩容磁盘也可以的。
你这个扩容本地磁盘空间即可了吧!
本质就是存储空间不够了。要么扩容节点,要么扩容存储空间。
可以选择扩容本地的逻辑卷,也可以扩容tikv节点,扩容节点后,region就会自动分布到新的节点,这样空间的使用率也就掉下去了
使用 Prometheus 和 Grafana 监控 TiKV 和 PD 的存储空间使用率,设置合理的告警阈值。
扩容对应的磁盘即可。
磁盘快写满了,你登录tikv所在机器df -h看看