【 TiDB 使用环境】生产环境
【 TiDB 版本】5.0.5
【遇到的问题:日常维护小白问题】
概述:生产环境一共7台机器,tidb的版本为5.0,部署情况如下图(图1),tidb相关系统用户均为tidb(非root),希望以下问题有大牛能直接基于实际部署现状来做详细解答。
问题1:当前1.1上运行的drainer的相关配置如何保存备份
问题2:假设1.1的机器坏了,重装操作系统后如何使用tiup并使用问题1备份的drainer配置重新部署drainer并启动
问题3:假设1.1的机器坏了,重装操作系统后如何重新安装alermanager,prometheus和grafana?同样相关配置文件如何保存备份
问题4:tiup工具现在只有1.6装了一份,如何在其它机器都装一个tiup工具并拷贝复制现在的部署配置,使得可以在任意机器使用tiup工具维护集群。
问题5:1.4和1.5 的tidb的配置如何保存一个备份,以及当1.4或者1.5机器坏了时,重装操作系统后如何使用tiup工具采用备份配置扩展/还原启动对应tidb节点
问题6:pd、pump、tikv 等节点也需要面临类似问题5一样的问题,要如何操作
问题7:使用tiup工具时,经常遇到提示ssh auth失败或者其它权限问题,要如何设置tiup工具所在机器和其它机器的权限,才能顺利使用tiup工具进行启停/扩缩节点。
问题8:tidb、pd、pump、tikv 这些节点如何使用tiup进行扩/缩?
问题9:当其中某个节点出问题挂掉时,有没有必要操作扩缩还是说tidb整个运行机制只要不是单节点本身就会自动容错(不影响性能)可以先不管它,只需要把错误解决后重新启动节点即可
问题10:问题1、2、3、4、5、6 涉及到的配置文件,需要配置文件中的必要参数和重要可选参数,参数含义和参数值含义的说明。