[Bug回報]TiUP1.4.0 scale-in TiFlash節點出現錯誤error

【TiDB 版本】:v4.0.11

【TiUP 版本】:v1.4.0

【问题描述】:
透過TiUP v1.4.0 scale-in TiFlash節點時出現以下錯誤:

Error: init config failed: 172.31.13.106:9093: transfer from /home/dba_tw/.tiup/storage/cluster/clusters/prd-aws-fenrir-tidbcluster/config-cache/alertmanager_172.31.13.106.yml to /usr/local/tidb-deploy/alertmanager-9093/conf/alertmanager.yml failed: failed to scp /home/dba_tw/.tiup/storage/cluster/clusters/prd-aws-fenrir-tidbcluster/config-cache/alertmanager_172.31.13.106.yml to tidb@172.31.13.106:/usr/local/tidb-deploy/alertmanager-9093/conf/alertmanager.yml: Process exited with status 1

Verbose debug logs has been written to /home/dba_tw/.tiup/logs/tiup-cluster-debug-2021-04-06-12-38-40.log.
Error: run /home/dba_tw/.tiup/components/cluster/v1.4.0/tiup-cluster (wd:/home/dba_tw/.tiup/data/STm0pt2) failed: exit status 1

查看 /home/dba_tw/.tiup/storage/cluster/clusters/prd-aws-fenrir-tidbcluster/config-cache/alertmanager_172.31.13.106.yml此檔案
=> 內容為default設定檔內容 不應該再scp蓋掉我們已設定的alertmanager.yml

alertmanager_172.31.13.106.yml (1.9 KB)

我們設定過的alertmanager.yml
alertmanager.yml (587 字节)

麻烦提供一下 tiup 的日志

您这面是对 alertmanager 的内容有修改是吗?

恩 我們需要透過slack發送alert 所以會修改alertmanager.yml

tiup日誌:
tiup-cluster-debug-2021-04-06-12-38-40.log (147.2 KB)

如果您这面的 alertmanager 配置文件发生了改变,您可以按照以下的文档修改一下 tiup 的配置。使用 tiup cluster edit-config XXX 修改 集群的 alertmanager 配置。
下面的 config_file 需要修改一下

config_file: /local/config/file

alertmanager_servers:
  - host: 10.0.1.11
    config_file: /local/config/file
  - host: 10.0.1.12
    config_file: /local/config/file

已edit-config修改如下:
alertmanager_servers:

  • host: 172.31.13.106
    ssh_port: 22
    web_port: 9093
    cluster_port: 9094
    deploy_dir: /usr/local/tidb-deploy/alertmanager-9093
    data_dir: /data/db/alertmanager-9093
    log_dir: /data/logs/alertmanager
    arch: amd64
    os: linux
    config_file: /usr/local/tidb-deploy/alertmanager-9093/conf/alertmanager.yml

但在reload後出現以下錯誤
open /usr/local/tidb-deploy/alertmanager-9093/conf/alertmanager.yml: no such file or directory

實際上這個檔案是在那台機器上存在的

問題已解決 感謝顧問 順便將內容post到AskTug
若有人遇到同樣問題可參考。

:+1:

1赞