对管理节点进行故障排除
永远不要通过raft从另一个节点复制目录来重新启动管理器节点。数据目录对于节点 ID 是唯一的。一个节点只能使用一次节点 ID 加入 swarm。节点 ID 空间应该是全局唯一的。
要将管理器节点干净地重新加入集群:
1.要将节点降级为工作程序,请运行docker node demote。
2.要从 swarm 中删除节点,请运行docker node rm。
3.使用 将节点重新加入具有新状态的群docker swarm join。
有关将管理器节点加入群的更多信息,请参阅将 节点加入群。
强行删除一个节点
在大多数情况下,您应该先关闭节点,然后再使用docker node rm命令将其从 swarm 中删除。如果节点变得无法访问、无响应或受到威胁,您可以通过传递--force标志来强行删除该节点,而无需将其关闭。例如,如果node9被入侵:
$ docker node rm node9
Error response from daemon: rpc error: code = 9 desc = node node9 is not down and can't be removed
$ docker node rm --force node9
Node node9 removed from swarm
在强行移除管理节点之前,您必须先将其降级为辅助角色。如果您降级或删除管理器,请确保您始终拥有奇数个管理器节点。