习惯上,先缩容监控节点,再扩容监控节点。
1. 优缺点
- 优点:清理更彻底
- 缺点:丢失历史监控数据
2. 步骤
以缩、扩容集群 kruidb 的监控节点 alertmanager、grafana、prometheus 为例:
2.1 缩容
- 语法格式:
tiup cluster scale-in kruidb-cluster -N <监控节点IP:端口>
- 缩容命令:
~]$ tiup cluster scale-in kruidb -N 192.168.3.220:9093 -N 192.168.3.220:3000 -N 192.168.3.220:9090
2.2 扩容
- 编写扩容配置文件 monitor.yaml
monitored:
node_exporter_port: 9100
blackbox_exporter_port: 9115
monitoring_servers:
- host: 192.168.3.220
grafana_servers:
- host: 192.168.3.220
alertmanager_servers:
- host: 192.168.3.220
- 执行扩容
## 1. 检查
tiup cluster check kruidb monitor.yaml --cluster
## 2. 修复
tiup cluster check kruidb monitor.yaml --cluster --apply --user root -p
## 3. 执行扩容
tiup cluster scale-out kruidb monitor.yaml
3. 注意事项
以上操作,已在 TiDB v6.1.0 中验证。希望对您遇到的问题能提供帮助。
tiup 1.10.2 增加了 timezone 的检查,在执行 check 时可能会报 timezone Fail no pd found, auto fixing not supported
,是个已知的问题,不影响扩容。tiup 1.9 中无此问题。