IBM Cloud Docs
Symphony 多集群故障诊断

Symphony 多集群故障诊断

如果 Lone symSymphony 集群在添加带有 SMC 的 Lone symSymphony 集群时不会与 SMC 连接,那么会发生什么情况?

尝试将 Lone Symphony 集群与 SMC 连接时,您的状态为 ERROR。

[root@hpc-primary-smc]# smcadmin cluster list
NAME     STATUS     MEMBERSHIP
lone       error      nonmember

发生此错误的原因如下:

  • 出站连接配置不成功
  • SMCP 服务可能在单交响乐集群中关闭
  • SMC 和孤交响乐集群之间的网络通信是不可通信的。
  • 使用的 VEMKD 端口 SMC 可能不正确。

要建立出站连接:

  • 在 SMCP.xml 中检查是否在孤交响乐集群中作为 <ego:EnvironmentVariable name="SMC_PROXY_INBOUND_CONNECTION">Y</ego:EnvironmentVariable> 启用出站
  • 如果 SMCP 服务在孤线程集群中关闭,请执行命令 egosh service start SMCP 以启动 SMCP 服务
  • 如果未发生网络连接,请检查是否在 Lone symSymphony 集群安全组中添加了 SMC cidr 块,反之亦然。

如何在尝试向 smc 添加孤独交响乐集群时解析 "文件结束或无输入: '操作中断或超时'"?

您会看到 thius 消息:

[root@hpc-primary-smc]# smcadmin cluster add -c lone1 -p 17870 -m "hpc-lone-primary-0,hpc-symphony-secondary-0"
End of file or no input: 'Operation interrupted or timed out'

当您尝试使用 SMC 添加孤单交响乐集群时,由于超时问题,您会收到警告消息。 此消息是一条警告消息,不会影响使用 SMC 添加孤单交响乐集群。

此错误不会影响使用 SMC 添加孤独的交响乐集群。 继续添加其他孤独的交响乐集群。

如果您尝试在 SMC 的辅助节点中以 egosh 用户身份登录,那么在供应 SMC 集群之后会立即发生什么?

供应 SMC 集群后,如果您立即尝试登录 SMC 的辅助节点,那么会看到以下消息:

[root@hpc-secondary-smc]# egosh user logon -u Admin -x Admin
bash: egosh command not found

使用 rsync 命令将 SMC 的主主机数据同步到 SMC 的辅助节点需要 10 分钟。

在供应 SMC 集群后等待 10 分钟,然后尝试登录。