IBM Cloud Docs
登录到 RHEL 主机以进行调试

登录到 RHEL 主机以进行调试

您可能需要登录到主机以进一步调试主机问题。

如果未将主机分配给集群,或者分配失败,那么可以通过 SSH 登录到主机。 否则,Satellite 将禁止出于安全目的使用 SSH 登录到主机。 您可以 除去主机 并重新装入操作系统,以将 SSH 功能复原到主机中。

  1. 登录到主机。

    ssh root@<IP_address>
    
  2. 检查来自主机注册和主机引导过程的各种日志输出文件。 将 <filepath> 替换为以下文件以按顺序进行检查。 根据问题,主机上可能存在某些日志文件,也可能不存在文件。

    1. 来自主机注册尝试的 nohup.out 日志。

    2. 第一次引导尝试的 /var/log/firstboot.log。 如果主机注册失败,那么您没有此文件。

    3. 基本引导过程的 /tmp/bootstrap/bootstrap_base.log (如果第一次引导失败)。 如果主机注册失败,那么您没有此文件。

      tail <filepath>
      
  3. 尝试再次连接主机以记录导致问题的 systemd 服务时,请运行 journalctl 命令。

    journalctl -u ibm-host-agent --no-pager
    
    journalctl -u ibm-firstboot --no-pager
    
    journalctl -u ibm-host-attach --no-pager
    
  4. 查看日志以查找错误。 请参阅以下部分以获取更多详细信息。

第一次引导未成功完成

您将收到类似于以下消息的输出。

export HOME=/root
HOME=/root
'[' '!' -f /var/log/firstboot.flag ']'
~

第一次引导未成功完成。 检查 /tmp/bootstrap/bootstrap_base.log 文件并继续查找错误。

主机注册脚本失败

您将收到类似于以下消息的输出。 请注意,可能会将软件包名称替换为另一个软件包名称。

No package matching '\''container-selinux'\'' found available, installed or updated
No package rh-python36 available. Error: Nothing to do

有关这些消息的更多信息,请参阅 主机注册脚本失败

无法在网络上访问机器

您将收到类似于以下消息的输出。

curl: (6) Could not resolve host: <URL>.com; Unknown error
tar -xvf bootstrap.tar
tar: This does not look like a tar archive
tar: Exiting with failure status due to previous errors
[[ -n ‘’ ]]
echo ‘Failed to untar bootstrap.tar’
Failed to untar bootstrap.tar` \n `+ rm -rf /tmp/bootstrap

无法在网络上访问机器。 检查您的机器是否满足 网络连接的最低要求除去主机,然后再次尝试 添加分配 主机。 或者,基础结构提供者网络可能存在问题,例如连接失败。 请参阅基础结构提供程序文档以了解进一步的调试步骤。

主机正在尝试向位置注册

您将收到类似于以下消息的输出。

kubectl --kubeconfig=/tmp/bootstrap/priveledgedcertdir/privledged-kubeconfig

主机正在尝试向该位置注册。

  1. 查找 Satellite 控制平面端点。

    ibmcloud sat location get --location <LOCATION_ID>
    
  2. 查找 公共服务端点 URL 字段,例如 https://c103-e.containers.cloud.ibm.com:12345

  3. 通过从主机运行 nc -z -v <ENDPOINT> 来确认连接存在。 例如

    nc -z -v c103-e.containers.cloud.ibm.com 12345
    
  4. 重复上一步以验证主机是否可以连接到每个必需的出站 区域的主机名