TiDB 在支持 TLS 安全加密管理问题

【 TiDB 使用环境】测试环境
【 TiDB 版本】v7.1.0
【遇到的问题:问题现象及影响】海外生产环境PCI TiDB promethous要求添加TLS 加密,在测试环境先测试,经测试promethous开启TLS安全加密后tiup cluster display xxx时promethous状态显示Down,重启promethous组件后data source相关TLS配置没有了
【附件:截图/日志/监控】


https://prometheus.io/docs/guides/tls-encryption/

配置步骤:

  1. generate a self-signed certificate and private key,Prometheus configuration
#Prometheus configuration config.yml
tls_server_config:
  cert_file: /data/tidb-deploy-tmp/prometheus-9249/certs/example.com/example.com.crt
  key_file: /data/tidb-deploy-tmp/prometheus-9249/certs/example.com/example.com.key

#修改prometheus启动脚本
http改成https   --web.external-url="https://10.x.x.136:10090/" \
添加  --web.config.file="/data/tidb-deploy-tmp/prometheus-9249/conf/config.yml" \
  1. 配置nginx反向代理,目的是将https转成http访问,原因是配置grafana Data Sources保存时报异常“HTTP Error Bad Request”
    image

  2. 配置 Data Sources

  3. 配置TLS完成后,grafana监控正常,但是查看集群状态promethous状态显示Down,实际promethous运行状态是正常的

  1. 于是重启了prometheus组件,display时prometheus状态仍然是Down。重启集群后,Data Sources TLS的认证配置没有了 ,TLS Client Auth按钮被关闭了

  2. 缩容promethous,报Error“no prometheus found in topology”

  3. 重新扩容promethous,之前的配置都没有了

有以下问题:

  1. 添加TLS后,集群prometheus状态显示Down
  2. 重启prometheus组件后,Data Sources TLS的认证配置没有了 ,TLS Client Auth按钮被关闭了
  3. 缩容prometheus时报Error“no prometheus found in topology”,实际缩容成功了
  4. 扩容prometheus组件,之前的相关prometheus TLS配置都没有了

本质上是 tiup 不支持 Prometheus 开启 tls

  1. 因为 tiup 获取 Prometheus 状态接口调不通,因为开了 tls
  2. reload Prometheus 等于:关闭 Prometheus + 刷新配置 + 启动 Prometheus。所以 tls 没了,因为配置被刷掉了
  3. 有具体操作和报错么
  4. 和二一样

想实现你需要的,要么 Prometheus 独立部署,不使用 tiup 管理。
要么给 tiup 提个产品需求来支持 Prometheus 开启 tls

或者你试试:
additional_args 和 additional_scrape_conf 两个参数是否能搞定。不过配置文件需要你在 Prometheus 上提前配置创建好

https://docs.pingcap.com/zh/tidb/stable/tiup-cluster-topology-reference#monitoring_servers

1 个赞

此话题已在最后回复的 7 天后被自动关闭。不再允许新回复。