针对导入的 AIX 映像推荐的 Reliable Scalable Cluster Technology (RSCT) 软件包级别
IBM Power Virtual Server 于 IBM 数据中心
IBM Power Virtual Server私有云 于 客户所在地
RSCT 是一组软件组件,它们共同为 AIX®,Linux®,Solaris 和 Windows ® 操作系统提供全面的集群环境。 RSCT 是各种 IBM 产品用于为集群提供改进的系统可用性,可伸缩性和易用性的基础结构。 对于 IBM® Power® Virtual Server 产品,RSCT 3.2.1 是导入的 AIX 映像所需的最低软件包级别 (提供 IPv6 支持)。 但是,Power Virtual Server 开发团队建议您使用 RSCT 3.2.6.2 以实现最佳性能。
如果要从没有 cloud-init
的网络安装管理 (NIM) 服务器部署 AIX VM,并且已安装 RSCT,那么不会重建 RSCT nodeid
。
资源管理控制 (RMC)
RMC 子系统 是 RSCT 的可扩展主干,它提供了用于管理单个系统或集群中的资源的通用框架。 其通用框架由集群管理工具用于监视,查询,修改和控制集群资源。 RMC 为 RSCT 对等域和管理域提供单个监视和管理基础结构。
AIX VM 的 RMC 状态在 Power Virtual Server 仪表板中显示为运行状态。 RMC 运行状况可以是 OK
或 Warning
。 当 VM 与管理系统之间的 RMC 子系统未连接时,将发生警告状态。
创建 AIX VM 时,将配置 VM 与系统管理服务之间的 RMC 连接。 部署 AIX VM 时,会将 IPv6 管理接口注入到 VM 中。 如果除去或覆盖此接口,那么无法进行 RMC 连接。 以下过程可能会导致在部署 AIX VM 后丢失注入的 IPv6 管理接口:
- 将其他引导卷连接到 VM 并从中引导
- 从私有云 VM 使用
mksysb restore
操作 - 使用
smitty
来除去 IPv6 接口
从缺少的 IPv6 链路本地地址进行诊断和恢复
其中一个 AIX VM 网络接口控制器 (NIC) 必须包含用于连接到 Novalink 主机的 IPv6 链路本地地址。 如果期望的 NIC 没有关联的 IPv6 链路本地地址,那么必须执行恢复过程。
诊断缺少的 IPv6 链路本地地址
在 AIX VM 终端上输入 ifconfig -a
命令,以查看其中一个 NIC 是否显示 IPv6 链路本地地址 (2001:1234:5723:ABCD:5678:D14E:DBCA:0764/64
)。以下示例是没有关联 IPv6 链路本地地址的 NIC:
en0: flags=1e084863,480<UP,BROADCAST,NOTRAILERS,RUNNING,SIMPLEX,MULTICAST,GROUPRT,64BIT,CHECKSUM_OFFLOAD(ACTIVE),CHAIN>
inet 192.168.2.104 netmask 0xfffffff0 broadcast 192.168.2.111
如果其中一个 NIC 不包含 IPv6 链路本地地址,请继续下一节。
使用 Power Virtual Server 引导映像从缺少的 IPv6 链路本地地址恢复
-
输入
lslpp -L rsct.*
命令以确保操作系统 (OS) 修改不会影响 RSCT 文件集级别。 有关更多信息,请参阅 在 AIX 节点上验证 RSCT 安装。Power Virtual Server 支持 3.2.1 作为最低发行版。 如果使用低于 3.2.1的软件包重新部署了 AIX 映像,那么必须首先升级 RSCT。
-
如果仍有 Power Virtual Server 已部署引导映像,请完成以下步骤:
-
引导至原始 Power Virtual Server 引导映像。
-
重新运行
ifconfig -a
命令。 输出包含已配置的 IPv6 链路本地地址。如果从原始引导映像配置中除去了 IPv6 链路本地地址,那么可以读取 AIX
cloud-init
日志以查找 IPv6 地址。 -
打开
/var/log/cloud-init-output.log
文件。 -
使用
grep
命令来搜索 IP 注入。 有一个 IPv4 地址和一个 IPv6 链路本地地址。
-
-
使用主机的 IPv6 地址,刷新 RMC 服务:
/opt/rsct/bin/rmcctrl -p /opt/rsct/bin/rmcrefreshMD -s ctrmc
-
(可选) 如果更改了
nodeid
(对于 RMC 而言是唯一的),那么会影响 RMC。 例如,当您使用 PowerHA 并尝试从不受支持的私有云部署复制nodeid
详细信息时。 首先重建节点:odmdelete -o CuAt -q name=cluster0 to remove 'cluster0' entry from the CuAt ODM.
-
(可选) 在 AIX VM 上,输入
cat /etc/ct_node_id
命令并保存输出。 -
(可选) 要创建新的
nodeid
并重新启动 RMC 服务:/usr/sbin/rsct/install/bin/recfgct
-
(可选) 要构建
nodeid
,请运行/opt/rsct/bin/rmcctrl -p
命令 (如果尚未在步骤 3 中执行)。
如果这些恢复步骤未将 RMC 状态复原为 active,并将其运行状况复原为 OK,请向 support 提交案例。
使用您自己的引导映像时从缺少的 IPv6 链路本地地址恢复
完成以下步骤以从缺少的 IPv6 链路本地地址恢复:
-
在关闭 AIX VM 之前,请获取 IPv6 详细信息。
-
使用
smitty
收集 IP 接口和适配器配置详细信息。 -
运行
/usr/sbin/rsct/bin/lsnodeid
命令以抓取nodeid
。 -
确认
nodeid
与cat /etc/ct_node_id
和cat /var/ct/cfg/ct_node_id
的输出相匹配。 -
关闭 AIX VM 的电源,并使用定制引导映像将其重新启动。
-
使用
smitty
在 IBM 引导映像上重新创建相同的网络配置。 -
通过运行
lslpp -L rsct.*
命令,验证 RSCT 软件包是否至少为 3.2.1 或更高版本。 -
运行
/usr/sbin/rsct/bin/lsnodeid
命令。 这将与 IBM 引导映像中的数据不匹配。 -
生成
nodeid
以与原始引导标识匹配。 再次启动 RMC 并等待 15 分钟。/usr/sbin/rsct/bin/rmcctrl -p odmdelete -o CuAt -q name=cluster0 (optional before the recfgct command) /usr/sbin/rsct/install/bin/recfgct – I value from /etc/ct_node_id (on the original IBM boot disk collected above)
-
运行
/usr/sbin/rsct/bin/lsnodeid
命令。 -
输出应该与 IBM 引导映像的输出相同。