恢复您的位置
以下步骤概述了从 Satellite 位置中的灾难事件进行恢复的常规流程。
-
更换“位置”控制平面中任何不正常的基础结构。 除去运行状况不佳的主机,然后连接新主机并将它们分配到控制平面。
-
在您的控制平面运行正常并且具有足够的容量以用于在 Satellite 位置运行的服务之后,将在 Satellite 平台中执行自动复原过程。
通常处于此状态时,位置会显示
R0025: The Satellite location has OpenShift clusters in critical health
警告。 -
打开支持案例以跟踪自动恢复的状态。 在案例详细信息中,提供以下信息。
Satellite Location: LOCATION-ID had a disaster event across the infrastructure associated with the Satellite location. We have proceeded to recover/replace the unhealthy infrastructure within the location control plane and have sufficient capacity to run all cluster control planes. These are the following OpenShift clusters within the location: CLUSTER-ID CLUSTER-ID
-
自动复原过程完成后,将除去
R0025
消息,并且该位置已准备好进行部署。 -
在该位置的每个 OpenShift 集群的数据平面中恢复或替换任何不正常的基础结构。 除去运行状况不佳的工作程序节点。 连接新主机并将其指定为工作程序节点。 重复此过程,直到集群中的所有工作程序节点都正常运行。
-
开始应用和持久存储 DR。 请参阅相应的特定于应用程序的文档或存储解决方案文档,以获取更多详细信息。