pd节点、tikv节点、tidb节点,直接用把进程kill掉或者这届关机,会集群有什么影响吗,还能正常提供服务吗

假如我有节点运维的需求,比如加磁盘空间啥的,能不能直接把节点进程杀掉,或者直接停服务器呢。如果节点拓扑是按3+3+3的部署的话。有没有人试过,会有啥的问题吗。

如果kill掉leader,肯定就不行了吧

有自动重启机制,tikv/pd 宕1个不影响,tidb 上面的连接中断

pd节点和tidb节点可能会行,但是不建议,tikv节点而且会影响线上业务相应速度,应该先tiup正常停止tikv节点的实例,服务器停机,加硬盘维护后,服务器启动,tiup正常启动tikv节点,观察以下监控的状况

Grafana PD -> PD Dashboard -> Region health
Grafana PD -> Operator -> Schedule Operator Create
Grafana PD --> Operator --> Operator finish duration

最好在确保高可用的前提下先停节点上服务再关机

1 个赞

保证多数派存活的情况下也不是不行,但是关机还是不太好,还是应该graceful shutdown

tikv/pd 宕1个不影响(大于等于3个节点的情况下)
tidb 已连接的中断

tikv/pd如果是多节点的在kill后涉及到事项
1)其他pd节点的选主,
2)tikv中的raft选主和副本转移或补副本
3)被kill的节点的自启动

直接kill是RTO < 30的场景,使用tiup正常停止节点,是RTO=0的场景,主动迁走leader,保持服务可用性,不香么?

1 个赞

此话题已在最后回复的 1 分钟后被自动关闭。不再允许新回复。