IBM Cloud Docs
IBM Cloud VPC 和 HANA db 跨区域灾难恢复自动化介绍

IBM Cloud VPC 和 HANA db 跨区域灾难恢复自动化介绍

您可以使用 Terraform 自动配置 IBM Cloud® VPC。 配置包括具有高网络性能的虚拟服务器实例。 对于 VPC 基础设施,有许多基础设施即服务( IaaS )产品,包括 Virtual Servers。 VPC 基础架构组件配置完成后,脚本会使用 Ansible playbooks 安装 SAP 系统。IBM Cloud VPC 基础架构由 SAP 认证的硬件组成,这些硬件使用英特尔®至强 CPU 和其他英特尔®技术。

IBM Cloud 虚拟数据中心介绍

VPC 是一种公共云产品,企业可利用它在共享的 公共云 基础设施上建立自己的类似私有云的计算环境。 VPC 使企业能够定义和控制一个在逻辑上与所有其他公共云租户隔离的虚拟网络,从而在公共云上创建一个私有、安全的空间。

想象一下,云提供商的基础设施是一栋住宅公寓楼,里面住着多个家庭。 作为公共云租户,就好比与几个室友共用一套公寓。 相比之下,拥有 VPC 就像拥有了自己的私人公寓;别人没有钥匙,没有你的允许,任何人都不能进入这个空间。 VPC 的逻辑隔离是通过使用虚拟网络功能和安全功能来实现的,这些功能可让企业客户对哪些 IP 地址或应用程序可以访问特定资源进行细粒度控制。 这类似于社交媒体账户上的“仅限好友”或“公开/私密”控制,用来限制谁可以或不可以看到你公开的帖子。

通过 IBM Cloud VPC,您可以使用用户界面、CLI 和 API 为具有高网络性能的 VPC 手动配置虚拟服务器实例。 VPC 基础设施包含多个基础设施即服务( IaaS )产品,包括 Virtual Servers for VPC。 使用以下信息了解为 VPC 规划、创建和配置资源的简单用例,并了解更多 VPC 概述和 VPC 教程。 有关 VPC 的更多信息,请参阅 开始使用虚拟专用云(VPC)

SAP 关于 IBM Cloud

SAP NetWeaver 是 技术栈的核心基础,也是用于 ABAP 和 应用程序的平台。SAP Java SAP 系统可在 IBM Cloud 中为各种系统和数据库类型进行安装和配置。

有关 IBM Cloud VPC 上 SAP 系统架构的更多信息,请参阅 SAP 中各支持数据库类型的基础架构参考架构。 例如,SAP NetWeaver 7.x on UNIX with HANA on IBM Cloud VPC 就是该 SAP 解决方案的专用参考架构。

在哪里运行脚本

脚本从部署服务器运行,因为部署服务器已经安装了 Terraform 和 Ansible。 SAP 工具包必须下载到部署服务器上为您分配的临时存储空间。 Ansible playbooks 会根据配置文件中指定的工具包位置为你安装工具包。

先决条件

  • 在 IBM Cloud VPC 上部署任何 SAP 自动解决方案之前,应在所选区域创建部署服务器(Bastion Server)。 部署服务器(Bastion Server)用于下载和存储以后自动化部署所需的特定 SAP 解决方案介质。 部署服务器(Bastion Server)既用于 CLI 部署方案,也用于 Schematics UI 部署。 部署服务器应与主 SAP HANA 系统位于同一 VPC 中。 有关如何创建部署服务器(堡垒服务器)及其相应 VPC 的详细信息,请参阅 Automate SAP bastion server - SAP 媒体存储库

  • 一对 SSH 密钥,用于连接 VSI。 公钥必须在 IBM Cloud 上传,并在 /root/.ssh/authorized_keys 的 SAP HANA 主系统 VSI 上手动添加。

  • 已部署的非 HA SAP HANA 主系统,位于与 SAP HANA 次系统(基于以下操作系统之一构建)所选区域不同的 VSI 上:SUSE Linux Enterprise Server 15 SP 4 for SAP, SUSE Linux Enterprise Server 15 SP 3 for SAP, Red Hat Enterprise Linux 8.6 for SAP 或 Red Hat Enterprise Linux 8.4 for SAP ),在 IBM Cloud Gen2 VPC 的一台主机上(有无 HA 均可)。

  • 应在主系统上为系统数据库和所有租户数据库执行完整的数据库备份。

自述文件中提到了用于验证该自动化的 IBM Cloud 操作系统镜像。

为节约成本,部署服务器(Bastion Server)及其 SAP 媒体专用存储设备可在 IBM Cloud VPC 云上成功实施 SAP 解决方案后停止使用。 或者,您可以保留部署服务器(堡垒服务器),并将其用作特定区域和未来部署的跳转主机。

这种自动化是免费提供的,但提供的基础设施需要付费。

SAP 项目价值指南 - 上的 VPC 和 HANA 数据库备份自动化 IBM Cloud Cloud Object Storage

SAP 这些项目的规模和预算差别很大,但没有一个是微不足道的。 无论是交付新的 SAP 系统,还是对现有系统进行更改,都要求在执行过程中不出差错,并缩短项目时间以实现效益。

在许多 SAP 项目中,部署 SAP 系统往往是一项关键且重复的任务。 本项目价值指南涵盖 IBM Cloud VPC 和 HANA db 跨区域 DR 的自动部署。 有关 SAP NetWeaver HANA 数据库和附加应用服务器(AAS)到 SAP 实例和 HANA 实例 的更多信息,将在其各自章节中讨论。

由于该系统是 SAP 项目的关键部分,您希望为现有的 SAP HANA 生产型数据库启用跨区域灾难恢复架构。

SAP HANA db 跨区域灾难恢复自动化模块

SAP HANA db 跨区域灾难恢复(DR)自动化模块将作为独立的自动化模块开发,并将集成到在 HANA 数据库上运行的任何已部署的 解决方案中。SAP

SAP HANA 自 2021 年 10 月起,云计算提供了在同一可用性区域内同步复制 Cloud 数据库或异步复制到其他区域的其他可用性区域的选项。SAP HANA

通过这些选项,您可以在 HANA db 上运行的现有 SAP 产品之上运行 HANA DR 跨区域自动化模块,从而建立高可用 (HA) 架构和/或灾难恢复 (DR) 架构。

在下图中,SAP HANA 数据库表示为 HANA 二级被动。 同步和异步复制架构同时适用于 HA 和 DR 场景。

图 1。 HANA HA(带 HSR 异步复制)
HANA HA(带 HSR 异步复制)

图 2。 HANA DR(带跨区域 HSR 异步复制)
HANA DR(带跨区域 HSR 异步复制)

不同的 RPO/RTO 值可与不同类型的故障相关联。 关键业务系统在运行时,如果出现局部故障,甚至通常在发生灾难时,其 RPO 也应为零数据丢失。 但灾难恢复所面临的挑战不同于本地可恢复故障。 要实现零 RPO 和低 RTO,必须在更远的距离上同步复制数据,这会影响常规系统性能,并可能需要更昂贵的备用和故障切换解决方案。 所有这些都会导致围绕故障恢复功能、成本和复杂性等属性做出权衡决策。

以下是系统复制的工作原理。 当辅助系统以实时复制模式运行时,每个服务组件都会与其主系统建立连接,并请求获取数据快照。 从这里开始,主系统中所有记录的更改都会被复制。

如果复制失败会怎样?

如果复制因网络故障而失败,那么可以设置为主系统提交事务或提交失败,直到复制恢复。

SAP HANA 支持多租户数据库容器。 系统复制只能为整个系统设置,而不能为每个租户设置。

每当日志在主系统中持久化(即写入每个服务的日志卷)时,它们也会被发送到辅助系统。 主系统中的事务在重做日志复制之前不会提交,这由日志复制选项决定:

  • 同步(用于 HA):主系统等待提交事务,直到收到次系统持久化日志的回复。 这种模式保证了两个系统之间的即时一致性,但代价是数据传输和在辅助系统中持久化的时间延迟了事务处理。

  • 内存同步:主系统在收到次系统收到日志的回复后,但在日志被持久化之前提交事务。 主系统的交易延迟时间较短,因为它只包括数据传输时间。

  • 异步(用于灾难恢复):主系统在发送日志后提交事务,无需等待响应。 这样就消除了同步延迟,但在故障时理论上会有少量数据丢失。 当辅助站点与主站点相距数百公里,或减少延迟至关重要时,这种模式最为有用。

HSR 可在主 HANA 系统和辅助 HANA 系统之间同步数据,确保即使在突发事件中也能访问关键数据。

系统复制 主系统对辅助系统进行连续(同步和异步)更新,包括辅助系统上的内存表加载和连续日志重放(如有配置)。

SAP HANA 系统复制功能可将 数据库复制到同一数据中心或另一数据中心的辅助位置,并实现持续同步。SAP HANA 通常,系统复制用于支持高可用性和灾难恢复。

数据中心之间的距离:

  • 系统复制提供同步和异步复制模式,以适应网络延迟。
  • 如果站点之间的距离小于 100 千米,则可以使用同步复制模式 SYNCSYNCMEM
  • 如果站点之间的距离超过 100 公里,则可以使用异步复制模式 ASYNC

Transit Gateway

使用 IBM Cloud Transit Gateway 可以创建单个或多个中转网关,将 VPC 连接在一起。 您还可以将 IBM Cloud 传统基础架构连接到中转网关,以提供与传统基础架构资源的无缝通信。 您连接到中转网关的任何新网络都会自动提供给连接到该网关的所有其他网络,这样您就可以随着网络的增长而扩展网络。

转接网关允许您将网络添加到本地网关,从而提供了灵活性。 网络可以连接到多个本地网关和一个全局网关,这样就能将本地流量保留在本地网关上。

IBM Cloud Transit Gateway 支持 VPC 与 IBM Cloud 传统基础架构之间的本地和全局路由选择。 所有路由选择都保留在专用 IBM Cloud 基础设施内,不在公共互联网上运行,并对性能进行了优化。IBM Cloud Transit Gateway 使客户在扩展工作负载和连接 IBM Cloud 上运行的孤立网络时,具有更大的灵活性、冗余性和速度。

  • 创建过境门户。

图 3。 创建 Transit Gateway
创建 Transit Gateway

  • Transit Gateway 现已创建并可用。

图 4. Transit Gateway
Transit Gateway

  • 中转网关显示两个连接,VSI 的 HANA 数据库实例位于两个不同的区域。

图 5. Transit Gateway 连接 连接 连接
Transit Gateway

网络延迟仪表板

区域间延迟仪表板提供 IBM Cloud® 中所有区域对的平均网络往返延迟(往返时间或 RTT)。 仪表盘显示以毫秒为单位的区域间 RTT 快照。 该快照是前 30 天多次测量的平均值。 对于每次测量,都会在 IBM Cloud 中的两个相应区域配置一对 Linux 虚拟机(配置文件为 cx2-8x16 )。 虚拟机到虚拟机的网络连接由 Transit Gateway 提供。 Netperf TCP RR 测试用于测量区域间虚拟机到虚拟机的延迟。

报告的结果是经过测量的。 这些仪表盘并不意味着性能保证。 这些统计数据提供了所有区域和分区之间延迟的可见性,可帮助您规划云部署的最佳选择,并对数据驻留和性能等情况进行规划。 这些仪表盘不用于故障排除。 有关更多信息,请参阅 网络延迟仪表板

在云平台上手动部署 VPC 并将 HANA 数据库配置为带有 Async HSR 跨区域复制功能的备用数据库,以实现灾难恢复,可能非常耗时。 Terraform 自动化不仅能确保更快地实施,还能确保部署标准化且不易出错。 Terraform 和 Ansible 用于自动化部署流程。

SAP 安装自动化

基于 Terraform 脚本和 Ansible playbooks 的自动化用于跨地区灾难恢复保护,以启用 VSI 上的非 HA SAP HANA 系统。 Ansible 是一个开源 IT 自动化引擎,可用于配置系统、部署软件和协调工作流,以支持应用部署和系统更新。 有关 Ansible 的更多信息,请参阅 Ansible 文档

Terraform 脚本会直接调用 Ansible playbooks。 首先由 Terraform 脚本创建 VPC 基础架构元素,然后使用 Ansible playbooks 进行 LVM 配置、操作系统设置、SAP HANA 辅助系统安装以及 DR 设置和启用。