登录到 RHEL 主机以进行调试
您可能需要登录到主机以进一步调试主机问题。
如果未将主机分配给集群,或者分配失败,那么可以通过 SSH 登录到主机。 否则,Satellite 将禁止出于安全目的使用 SSH 登录到主机。 您可以 除去主机 并重新装入操作系统,以将 SSH 功能复原到主机中。
-
登录到主机。
ssh root@<IP_address>
-
检查来自主机注册和主机引导过程的各种日志输出文件。 将
<filepath>
替换为以下文件以按顺序进行检查。 根据问题,主机上可能存在某些日志文件,也可能不存在文件。-
来自主机注册尝试的
nohup.out
日志。 -
第一次引导尝试的
/var/log/firstboot.log
。 如果主机注册失败,那么您没有此文件。 -
基本引导过程的
/tmp/bootstrap/bootstrap_base.log
(如果第一次引导失败)。 如果主机注册失败,那么您没有此文件。tail <filepath>
-
-
尝试再次连接主机以记录导致问题的 systemd 服务时,请运行
journalctl
命令。journalctl -u ibm-host-agent --no-pager
journalctl -u ibm-firstboot --no-pager
journalctl -u ibm-host-attach --no-pager
-
查看日志以查找错误。 请参阅以下部分以获取更多详细信息。
第一次引导未成功完成
您将收到类似于以下消息的输出。
export HOME=/root
HOME=/root
'[' '!' -f /var/log/firstboot.flag ']'
~
第一次引导未成功完成。 检查 /tmp/bootstrap/bootstrap_base.log
文件并继续查找错误。
主机注册脚本失败
您将收到类似于以下消息的输出。 请注意,可能会将软件包名称替换为另一个软件包名称。
No package matching '\''container-selinux'\'' found available, installed or updated
No package rh-python36 available. Error: Nothing to do
有关这些消息的更多信息,请参阅 主机注册脚本失败。
无法在网络上访问机器
您将收到类似于以下消息的输出。
curl: (6) Could not resolve host: <URL>.com; Unknown error
tar -xvf bootstrap.tar
tar: This does not look like a tar archive
tar: Exiting with failure status due to previous errors
[[ -n ‘’ ]]
echo ‘Failed to untar bootstrap.tar’
Failed to untar bootstrap.tar` \n `+ rm -rf /tmp/bootstrap
无法在网络上访问机器。 检查您的机器是否满足 网络连接的最低要求,除去主机,然后再次尝试 添加 并 分配 主机。 或者,基础结构提供者网络可能存在问题,例如连接失败。 请参阅基础结构提供程序文档以了解进一步的调试步骤。
主机正在尝试向位置注册
您将收到类似于以下消息的输出。
kubectl --kubeconfig=/tmp/bootstrap/priveledgedcertdir/privledged-kubeconfig
主机正在尝试向该位置注册。
-
查找 Satellite 控制平面端点。
ibmcloud sat location get --location <LOCATION_ID>
-
查找 公共服务端点 URL 字段,例如
https://c103-e.containers.cloud.ibm.com:12345
。 -
通过从主机运行
nc -z -v <ENDPOINT>
来确认连接存在。 例如nc -z -v c103-e.containers.cloud.ibm.com 12345
-
重复上一步以验证主机是否可以连接到每个必需的出站 区域的主机名。