IBM Cloud Docs
지원 센터에 문의

지원 센터에 문의

클러스터에 여전히 문제점이 있습니까? Red Hat OpenShift on IBM Cloud 클러스터에 대한 도움 및 지원을 받으려면 여러 가지 방법을 검토하십시오. 모든 질문 또는 피드백은 Slack에 게시하십시오.

지원 케이스를 열기 전에 클러스터 환경에 대한 관련 정보를 수집하십시오.

진단 및 디버그 도구를 찾고 계신가요? 해당 애드온은 더 이상 지원되지 않습니다. IBM Cloud Monitoring 클러스터의 문제를 모니터링하고 진단하는 데 권장됩니다. 관련성이 있을 수 있는 추가 문제 해결 링크는 크리티컬 또는 NotReady 상태의 작업자 노드 문제 해결IBM Cloud Kubernetes Service 의 앱 문제 해결을 참조하세요.

클러스터 세부 정보 가져오기

  1. 클러스터 세부사항을 가져오십시오.

    ibmcloud oc cluster get -c <cluster_name_or_ID>
    
  2. 문제가 작업자 노드와 관련된 경우 작업자 노드 세부사항을 가져오십시오.

    1. 클러스터에 모든 작업자 노드를 나열하고 상태(State) 또는 **상태(Status)**가 비정상적인 작업자 노드의 ID를 기록해 두십시오.

      ibmcloud oc worker ls -c <cluster_name_or_ID>
      
    2. 비정상적인 작업자 노드의 세부사항을 가져오십시오.

      ibmcloud oc worker get -w <worker_ID> -c <cluster_name_or_ID>
      
  3. 클러스터에 있는 리소스(예: 팟(Pod) 또는 서비스)에 대한 문제의 경우에는 클러스터에 로그인한 후 Kubernetes API를 사용하여 더 자세한 정보를 가져오십시오.

오류 로그 및 기타 정보 수집

must-gather 명령 실행

oc adm must-gather CLI 명령은 문제 디버깅을 위해 클러스터에서 정보를 수집합니다. 필수 수집 도구는 리소스 정의, 서비스 로그 등을 수집합니다. 파일 크기를 줄이기 위해 감사 로그는 기본 정보 집합의 일부로 수집되지 않습니다.

oc adm must-gather 을 실행하면 클러스터의 새 프로젝트에 임의의 이름을 가진 새 파드가 만들어집니다. 데이터는 해당 포드에서 수집되어 must-gather.local 로 시작하는 새 디렉터리에 저장됩니다.

다음 예제 명령을 검토하세요.

oc adm must-gather

예제 하나 이상의 특정 기능과 관련된 데이터를 수집하려면 특정 이미지와 함께 --image 인수를 사용합니다.

oc adm must-gather \
--image=registry.redhat.io/container-native-virtualization/cnv-must-gather-rhel9:v4.17.5

감사 로그를 수집하는 명령의 예입니다.

oc adm must-gather -- /usr/bin/gather_audit_logs

특정 네임스페이스에서 must-gather를 실행하는 명령 예시입니다.

oc adm must-gather --run-namespace <namespace> \
--image=registry.redhat.io/container-native-virtualization/cnv-must-gather-rhel9:v4.17.5

지정된 시간의 로그를 수집하는 명령어 예시입니다.

oc adm must-gather --since=24h
oc adm must-gather --since-time=$(date -d '-24 hours' +%Y-%m-%dT%T.%9N%:z )

네트워크 로그를 수집하는 명령 예시.

oc adm must-gather -- gather_network_logs

더 많은 예제와 인수를 보려면 다음 명령을 실행하세요

oc adm must-gather -h

필수 수집 디렉터리에서 압축 파일을 생성하는 명령 예제입니다.

tar cvaf must-gather.tar.gz must-gather.local.5421342344627712289/

지원 케이스에 압축 파일을 첨부하세요.

SOS 보고서 수집

sosreport 는 Red Hat Enterprise Linux (RHEL) 및 Red Hat Enterprise Linux CoreOS (RHCOS) 시스템에서 구성 세부 정보, 시스템 정보 및 진단 데이터를 수집하는 도구입니다. 노드와 관련된 진단 정보를 수집하는 표준화된 방법을 제공하여 문제 진단을 위한 지원팀에 제공할 수 있습니다.

일부 지원 상호작용에서 지원팀은 특정 OpenShift Container Platform 노드에 대한 sosreport 아카이브를 수집하도록 요청할 수 있습니다. 예를 들어 oc adm must-gather 의 출력에 포함되지 않은 시스템 로그 또는 기타 노드별 데이터를 검토해야 할 수 있습니다.

OpenShift Container Platform 클러스터 노드에 대해 sosreport 를 생성하는 권장 방법은 디버그 파드를 사용하는 것입니다.

Red Hat OpenShift 클러스터에 액세스하십시오.

  1. 작업자 노드를 나열하십시오.

    oc get nodes
    
  2. 대상 노드에서 디버그 세션을 시작합니다.

    oc debug node/node_name
    

    NoExecute 효과로 오염된 대상 노드에서 디버그 세션에 들어가려면 임시 네임스페이스에 톨러레이션을 추가하고 임시 네임스페이스에서 디버그 파드를 시작하세요.

    oc new-project temp oc patch namespace temp --type=merge -p '{"metadata": {"annotations": { "scheduler.alpha.kubernetes.io/defaultTolerations": "[{\"operator\": \"Exists\"}]"}}}'
    
    oc debug node/my-cluster-node
    
  3. 디버그 셸 내에서 /host 을 루트 디렉터리로 설정합니다. 디버그 파드는 호스트의 루트 파일 시스템을 포드 내의 /host 에 마운트합니다. 루트 디렉터리를 /host 로 변경하면 호스트의 실행 경로에 포함된 바이너리를 실행할 수 있습니다.

    chroot /host
    

    OpenShift Container Platform Red Hat Enterprise LinuxCoreOS (RHCOS)를 실행하는 클러스터 노드는 불변이며, 클러스터 변경 사항을 적용하기 위해 오퍼레이터에 의존합니다. SSH를 사용하여 클러스터 노드에 액세스하는 것은 권장하지 않습니다. 그러나 OpenShift Container Platform API가 사용 불가능하거나 대상 노드에서 kubelet이 제대로 작동하지 않을 경우, oc operations 작업에 영향을 미칠 수 있습니다. 이러한 상황에서는 대신 ssh core@<node>.<cluster_name>.<base_domain> 을 사용하여 노드에 액세스할 수 있습니다.

  4. sosreport 을 실행하는 데 필요한 바이너리와 플러그인이 포함된 도구 상자 컨테이너를 시작합니다.

    toolbox
    

    기존 도구 상자 파드가 이미 실행 중인 경우, 도구 상자 명령은 'toolbox-' already exists. Trying to start…. podman rm toolbox- 으로 실행 중인 도구 상자 컨테이너를 제거하고 새 도구 상자 컨테이너를 시작합니다.

  5. sos report 명령을 실행하고 메시지에 따라 문제 해결 데이터를 수집합니다.

    sos report -k crio.all=on -k crio.logs=on -k podman.all=on -k podman.logs=on
    

    보고서에 노드의 OVN- Kubernetes 네트워킹 구성에 대한 정보를 포함하는 명령의 예입니다.

    sos report --all-logs
    

    sosreport 출력은 아카이브의 위치와 체크섬을 제공합니다. 다음 샘플 출력 참조는 지원 사례 ID 01234567. 툴박스 컨테이너는 호스트의 루트 디렉터리를 /host 에 마운트하기 때문에 파일 경로는 chroot 환경 외부에 있습니다.

    Your sosreport has been generated and saved in:
    /host/var/tmp/sosreport-my-cluster-node-01234567-2020-05-28-eyjknxt.tar.xz
    The checksum is: 382ffc167510fd71b4f12a4f40b97a4e
    
  6. sosreport 을 파일로 출력합니다.

    디버그 컨테이너는 호스트의 루트 디렉터리를 /host 에 마운트합니다. 연결할 대상 파일을 지정할 때 /host 를 포함하여 디버그 컨테이너의 루트 디렉터리에서 절대 경로를 참조하세요.

    oc debug node/my-cluster-node -- bash -c 'cat /host/var/tmp/sosreport-my-cluster-node-01234567-2020-05-28-eyjknxt.tar.xz' > /tmp/sosreport-my-cluster-node-01234567-2020-05-28-eyjknxt.tar.xz
    

    OpenShift Container Platform Red Hat Enterprise LinuxCoreOS (RHCOS)를 실행하는 클러스터 노드는 불변이며, 클러스터 변경 사항을 적용하기 위해 오퍼레이터에 의존합니다. scp 을 사용하여 클러스터 노드에서 sosreport 아카이브를 전송하는 것은 권장되지 않습니다. 그러나 OpenShift Container Platform API가 사용 불가능하거나 대상 노드에서 kubelet이 제대로 작동하지 않을 경우 작업에 영향을 미칠 oc 수 있습니다. 이러한 상황에서는 scp core@<node>.<cluster_name>.<base_domain>:<file_path> <local_path> 을 실행하여 노드에서 sosreport 아카이브를 복사할 수 있습니다.

  7. 지원 케이스에 파일을 업로드하세요.

지원 케이스 열기

  1. IBM 지원팀에 문의하여 케이스를 개설하세요.

  2. 문제 유형은 Red Hat OpenShift on IBM Cloud 을 검색하거나 선택합니다.

  3. 케이스 세부사항에 대해, 설명적 제목을 제공하고 이전에 수집한 세부사항을 포함시키십시오. 리소스에서 문제가 관련된 클러스터를 선택할 수도 있습니다.

  4. IBM 지원 센터에서 문제를 해결하는 데 도움을 줄 수 있다고 생각하는 아키텍처 다이어그램 또는 보충 자료를 포함하여 가능한 구체적으로 하십시오.