IBM Cloud Docs
IBM Spectrum Symphony 문제점 해결

IBM Spectrum Symphony 문제점 해결

IBM Cloud Schematics 가 사설 GitHub 저장소를 복제할 수 없는 이유는 무엇입니까?

Schematics 가 개인용 GitHub 저장소를 복제할 수 없으며 다음 오류 메시지가 표시됩니다. Failed to clone git repository, repository not found (check url, also check the scope 'repo' of the personal access token if SCHEMATICSGITTOKEN is used)

올바른 GitHub 토큰을 제공하지 않았거나 GitHub 토큰을 함께 제공하지 않았습니다.

GitHub 토큰 을 제공하고 작업공간 작성 API의 github_token 매개변수에 올바른 GitHub 토큰이 제공되었는지 확인하십시오.

IBM Cloud Schematics 가 공용 GitHub 저장소를 복제할 수 없는 이유는 무엇입니까?

Schematics 는 공용 GitHub 저장소를 복제할 수 없으며 다음 오류 메시지 중 하나가 표시됩니다.

  • Fatal, could not download repo, Failed to clone git repository, authentication required (or the git url is incorrect). Problems found with the Repository. Please Rectify and Retry
  • Template error: Failed to clone git repository, authentication required (or the git url is incorrect)

올바른 GitHub URL을 제공하지 않았거나 공용 저장소를 복제하는 데 필요하지 않은 GitHub 토큰을 제공했습니다. GitHub 액세스 토큰은 개인용 저장소에 액세스하는 경우에만 필요합니다.

GitHub 토큰을 제공하지 말고 공용 저장소를 사용하여 작업공간을 작성하는 동안 GitHub 토큰이 github_token 매개변수에 제공되었는지 확인하십시오.

IBM Cloud Schematics 가 작업공간을 작성할 수 없는 이유는 무엇입니까?

Schematics 가 작업공간을 작성할 수 없으며 다음 오류 메시지가 표시됩니다. You don't have the required to create a workspace in any resource groups. You must be assigned the manager role on the Schematics service in at least one resource group. Contact your account administrator for access.

리소스 그룹에서 작업공간을 작성하는 데 필요한 액세스 권한이 없습니다. 하나 이상의 리소스 그룹에서 Schematics 서비스에 대한 관리자 역할이 지정되어야 합니다.

계정 관리자에게 문의하여 하나 이상의 리소스 그룹에서 Schematics 서비스에 대한 관리자 역할을 지정받으십시오.

IBM Cloud Schematics 가 클러스터를 프로비저닝할 수 없고 symphony_license_confirmation 변수에 대한 오류 메시지와 함께 실패하는 이유는 무엇입니까?

Schematics 가 클러스터를 프로비저닝할 수 없으며 다음 오류 메시지가 표시됩니다. Error: Invalid value for variable "symphony_license_confirmation"

symphony_license_confirmation 특성에 "true" 이외의 값을 입력했습니다.

symphony_license_confirmation 특성은 "true" 만 올바른 값으로 승인합니다. "true" 값은 다음 두 조건 중 하나에 동의했음을 표시합니다.

  1. 프로덕션 클러스터를 배치하는 경우 비즈니스 팀과 함께 IBM Spectrum LSF 을 IBM Cloud 에 배치할 수 있는 충분한 라이센스가 있으며 이러한 라이센스는 IPLA (International Program License Agreement) 에서 사용할 수 있음을 확인했습니다.
  2. IBM Cloud 에서 IBM Spectrum LSF 을 사용하여 평가 클러스터를 배치하고 프로그램 평가를 위한 국제 라이센스 계약 (ILAE) 을 준수하는 데 동의합니다.

IPLA및 ILAE 모두에 대한 IBM 소프트웨어 사용 조건은 여기에서 확인할 수 있습니다.

두 조건 중 하나에 동의한 후 특성 값을 "true" 로 업데이트하고 다시 시도하십시오.

IBM Cloud Schematics 가 클러스터를 프로비저닝할 수 없고 권한 부여 오류로 실패하는 이유는 무엇입니까?

Schematics 가 클러스터를 프로비저닝할 수 없으며 다음 오류 메시지가 표시됩니다. Request is not authorized. Check your user permissions and authorizations and try again.

프로비저닝된 VPC 리소스를 가져오는 데 필요한 액세스 권한이 없습니다.

계정 관리자에게 문의하여 필요한 모든 액세스 권한을 얻으십시오. 자세한 정보는 필수 권한 을 참조하십시오.

IBM Cloud Schematics 가 클러스터를 프로비저닝할 수 없고 제공된 이름이 고유하지 않다는 오류로 실패하는 이유는 무엇입니까?

Schematics 는 클러스터를 프로비저닝할 수 없으며 다음 예제 오류 메시지가 표시됩니다.

"code": "validation_unique_failed",
"message": "Provided Name (sample-symphony-vpc) is not unique",
"target": {
"name": "name",
"type": "field",
"value": "sample-symphony-vpc"
}

VPC 리소스 이름은 고유해야 합니다. 동일한 이름의 자원이 있는 경우 유사한 오류가 발생할 수 있습니다.

기존 자원을 디프로비저닝하고 다시 시도하십시오.

IBM Cloud Schematics 가 사용자 정의 이미지를 사용하는 동안 클러스터를 프로비저닝할 수 없는 이유는 무엇입니까?

사용자 정의 이미지를 사용하는 동안 Schematics 가 클러스터를 프로비저닝할 수 없으며 다음 오류 메시지 중 하나가 표시됩니다.

  • The argument "image" is required, but no definition was found.
  • Unknown variable. There is no variable named "image_id".

가상 서버 인스턴스 중 하나에 사용되는 사용자 정의 이미지가 대상 지역 및 구역에 없거나 클러스터를 프로비저닝하는 데 사용되는 계정 및 API키로 액세스할 수 없습니다.

가상 서버 인스턴스에 대해 사용자 정의 이미지를 사용하는 경우, 사용자 정의 이미지가 대상 지역 및 구역에서 사용 가능하고 클러스터를 프로비저닝하는 데 사용되는 계정 및 API키로 액세스할 수 있는지 확인하십시오.

내 새로 고치기 토큰에 대한 오류를 수신하는 이유는 무엇입니까?

플랜 생성, 플랜 적용리소스 영구 삭제 요청에서 새로 고치기 토큰 오류를 수신합니다. Error: The provided Refresh Token is invalid. Please provide a proper refresh token for Terraform to run the configuration. Code: 400

올바른 새로 고치기 토큰을 제공하지 않았거나 새로 고치기 토큰을 모두 제공하지 않았습니다.

curl 명령을 사용하여 생성된 새로 고치기 토큰이 올바른지 확인하십시오. 그렇지 않으면 새로 고치기 토큰을 다시 생성하십시오.

내 작업공간에 변경사항을 적용할 때 오류가 발생하는 이유는 무엇입니까?

작업공간에 변경사항을 적용하려고 할 때 다음 오류가 수신됩니다. Apply failed due to "Error: Error Deleting Volume : The volume is still attached to an instance."

볼륨 프로파일, 용량 또는 IOPS를 다시 구성한 후에는 변경사항을 적용하기 전에 작업공간을 정리해야 합니다.

기존 리소스를 영구 삭제하고 변경사항을 다시 적용해야 합니다. 기존 리소스를 영구 삭제하면 스토리지 노드의 데이터가 삭제됩니다.

제공된 ssh_key_name값으로 오류를 수신하는 이유는 무엇입니까?

Schematics 작업공간에서 계획을 생성하거나 적용하려고 할 때 다음 오류가 수신됩니다. failed due to "Error: No SSH Key found with name <KEY_NAME>".

Terraform이 사용자가 제공한 제공된 SSH키 이름을 찾을 수 없습니다.

  1. 제공된 SSH키가 클러스터가 프로비저닝되는 현재 지역에 있는지 확인하십시오. 제공된 SSH키가 없는 경우 현재 리젼에서 SSH키를 작성하십시오.
  2. 여러 SSH키를 구성하는 동안 SSH키 이름 앞이나 뒤에 추가된 공백이 없는지 확인하십시오.
  3. 여러 SSH키를 사용하는 경우 SSH키 사이에 쉼표 (,) 가 구분 기호로 사용되는지 여부와 SSH키 앞이나 뒤에 추가된 공백이 없는지 여부를 확인하십시오.

Spectrum Symphony VaR 시뮬레이션을 실행하려고 할 때 오류가 발생하는 이유는 무엇입니까?

Spectrum Symphony 위험 값(VaR)시뮬레이션을 실행하려고 할 때 Failed to Login 오류가 발생합니다.

클러스터 접두부가 10자이하여야 하고 Symphony 기본 호스트 호스트 이름이 20자미만이어야 하는 VaR 시뮬레이션의 제한사항에 도달할 수 있습니다.

클러스터 접두부가 10자를 초과하지 않는지 확인하십시오.

워크로드가 진행 중일 때 작업자 노드가 해제됨

symA 요청자는 워크로드가 여전히 진행 중인 동안 계산 노드 가상 머신을 해제할 수 있습니다. 이는 return_idle_only 특성이 true로 설정되고 즉시 리턴 정책 symA 가 이 호스트에 대한 할당을 가져올 수 없어서 할당이 없다고 가정하는 경우에 발생합니다. 이 문제는 모니터할 애플리케이션에 대해 몇 개의 태스크만 남아 있는 경우에 발생합니다. 자세한 정보는 작업자 노드가 제거되기 전 유휴 시간 업데이트 를 참조하십시오.

올바르지 않은 제공자 구성 값으로 인해 오류가 발생하지 않습니다.

Symphony GUI의 메뉴 아이콘 메뉴 아이콘 자원 > 클라우드 > 구성에서 IBM Cloud 제공자 구성을 업데이트할 때 구성에 설정된 값은 유효성 검증되지 않습니다. 구성에 올바르지 않은 값이 있는 경우 가상 머신 프로비저닝이 실패합니다. 장애가 발생하면 /opt/ibm/spectrumcomputing/hostfactory/log for more information 에서 HostFactory 서비스를 실행하는 호스트의 호스트 팩토리 로그를 확인하십시오.

전용 호스트에 사용 가능한 프로파일의 제한사항

이 오퍼링은 전용 호스트의 인스턴스 프로파일이 작업자 인스턴스 (worker_node_instance_type) 의 경우와 동일한 접두부 (예: bx2 및 cx2) 가 되도록 자동으로 선택합니다. 그러나 사용 가능한 인스턴스 접두부는 대상 리젼에 따라 제한될 수 있습니다. 전용 호스트를 사용하는 경우 ibmcloud target -r {region_name}ibmcloud is dedicated-host-profiles 를 확인하여 worker_node_instance_type 에 대상 리젼에 사용 가능한 접두부가 있는지 확인하십시오.

인증 또는 제한시간 초과 문제로 인해 자원 오류가 표시되는 이유는 무엇입니까?

특정 자원을 작성하는 동안 다음 오류 메시지를 수신합니다.

  • Error: An error occurred while performing the ‘authenticate’ step: Post “https://iam.cloud.ibm.com/identity/token”: context deadline exceeded (Client.Timeout exceeded while awaiting headers)
  • Error: timeout while waiting for state to become 'done, ' (last state: 'provisioning', timeout: 10m0s)

Schematics 가 인프라 리소스를 배치하는 동안 API 호출을 통해 IBM Cloud 으로 인증합니다. API를 통해 클라우드 환경에 너무 많은 요청이 있는 경우 Schematics 는 인증할 수 없으며 인증 오류로 인해 오류가 발생할 수 있습니다.

문제 (인증 오류 또는 제한시간 초과 오류로 인해 자원이 실패함) 를 수정하려면 Schematics 작업공간에서 자원을 영구 삭제하고 자원 배치를 재시도하십시오.

SSH 문제로 인해 클러스터 작성이 실패하는 이유는 무엇입니까?

Ansible 프로비저너가 작업자 및 스토리지 노드 리소스에서 Storage Scale 함수를 설정하려고 시도할 때 다음 오류 메시지를 수신합니다.

  • msg": "Failed to connect to the host via ssh, Connection closed by UNKNOWN port 65535", "unreachable": true}
  • Error: Failed to connect to the host via ssh: Connection timed out during banner exchange", "unreachable

Schematics 가 인프라 리소스를 배치하는 동안 자동화 코드는 Ansible 프로비저너의 도움으로 가상 서버 인스턴스 노드에서 Storage Scale 기능을 설정하는 데 필요한 몇 개의 Ansible 플레이북으로 구성됩니다. Ansible 프로비저너가 Storage Scale 기능을 사용하기 위해 이러한 노드에 SSH를 시도하면 노드가 unreachable 상태가 됩니다.

문제를 수정하기 위해 다음을 수행할 수 있습니다.

  1. 작업공간에서 자원을 영구 삭제하고 다시 배치하십시오.
  2. 모든 배치에서 이 문제가 관찰되면 IBM Cloud 지원 팀에서 지원 문제를 제기하여 인프라 문제가 있는지 조사하십시오.
  3. 인프라에 문제가 없는 경우 추가로 조사할 수 있는 자동화 팀에 이 문제를 보고하십시오.

이미지를 찾을 수 없다는 오류를 수신하는 이유는 무엇입니까?

작업공간에 계획을 생성하거나 적용하려고 할 때 다음 오류를 수신합니다. Apply failed due to "Error: [ERROR] No image found with name hpcc-symp731-scale5151-rhel84-v1-4".

플랜을 생성하거나 적용하는 동안 Terraform은 제공된 이미지 이름 및 해당 이미지 ID가 image_map.tf 파일에 있는지 유효성 검증하려고 시도합니다. Terraform이 올바른 이미지 세부사항을 찾으면 인스턴스를 프로비저닝하지만 올바른 이미지 세부사항을 찾을 수 없는 경우 Terraform은 data_source 를 통해 IBM Cloud 에서 이미지 세부사항을 페치하려고 시도합니다.

제공된 이미지가 해당 특정 지역의 클라우드에 없는 경우에도 여전히 오류를 수신할 수 있습니다.

제공된 이미지 이름에 공백이 있는지 여부와 배치를 수행할 지역에 해당 이미지가 있는지 여부를 확인해야 합니다.

cannot_start_capacity 오류를 수신하는 이유는 무엇입니까?

작업공간에 계획을 적용하려고 할 때 다음 오류가 수신됩니다. Apply failed due to "code : cannot_start_capacity : message : Can't start instance because resource capacity is unavailable.

적용 플랜 프로세스 중에 Terraform은 선택된 배치 값을 기반으로 가상 서버 인스턴스 프로비저닝 또는 베어메탈 서버 프로세스를 시작합니다. 배치하려는 지역의 리소스 용량 문제 또는 할당량 문제가 있는 경우 리소스가 예상대로 프로비저닝되지 않습니다.

계정 관리자에게 문의하여 특정 지역에 대한 할당량을 늘리거나 클라우드 인프라와 연관된 원하지 않는 모든 리소스를 정리할 수 있습니다. 원하지 않는 자원을 정리하는 경우 배치에서 처리할 공간을 확보할 수 있습니다.

클러스터가 IBM 고객 번호 오류로 실패하는 이유는 무엇입니까?

작업공간에 계획을 적용하려고 할 때 다음 오류가 수신됩니다. Apply failed due to "ERROR - [CLOUD-DEPLOY] Provided IBM Customer Number is not entitled to use Spectrum Symphony on Cloud. Kindly contact IBM Support Team. Exiting!

적용 계획 프로세스 중에 부트스트랩 노드는 스토리지 및 컴퓨팅 클러스터 작성을 위한 자원 프로비저닝을 시작합니다. 프로세스 중에 RPM및 GPFS 관련 패키지와 Symphony 패키지는 BYOL 개념을 통해 복호화되어야 합니다. IBM 고객 번호가 유효하면 배치가 시작됩니다. 그렇지 않으면 자동화에서 배치 오류가 발생합니다.

숫자에 공백 없이 Spectrum Symphony 에 대한 자격이 있는 유효한 IBM 고객 번호를 제공해야 합니다. 제공한 값이 올바르지만 여전히 이 오류를 수신하는 경우 IBM 지원 센터에 문의하여 인타이틀먼트에 대해 명확하게 설명하십시오.

내 인스턴스 프로비저닝이 Starting 상태로 유지되는 이유는 무엇입니까?

계획을 적용한 후에는 작업공간에서 가상 서버 인스턴스를 프로비저닝하는 데 시간이 오래 걸리며 사용자 인터페이스에서 가상 서버 인스턴스가 Starting 상태로 유지됨을 알 수 있습니다.

적용 플랜 프로세스 중에 Terraform은 클라우드 인프라에서 가상 서버 인스턴스의 프로비저닝 프로세스를 시작합니다. 해당 특정 지역 및 구역에 대한 인프라 측의 문제 또는 용량 문제가 있는 경우 이 문제가 표시될 수 있습니다.

자동화 프로세스 중에 사용되는 동일한 이미지를 사용하여 사용자 인터페이스에서 수동으로 인스턴스를 작성하도록 시도하여 동일한 문제가 발생하는지 여부를 확인하거나 배치에 대해 다른 구역을 시도할 수 있습니다. 또한 이 문제에 대한 지원 요청을 제기하여 인프라 측에서 시작되었는지 여부를 확인할 수 있습니다.

Bare Metal Server가 프로비저닝에 실패한 후 리소스를 삭제하려고 할 때 오류가 발생하는 이유는 무엇입니까?

베어메탈 서버가 프로비저닝에 실패하고 부트스트랩 노드에서 리소스를 삭제하려고 시도하면 mmcloudworkflows cluster destroy 명령을 적용한 후 다음 오류가 수신됩니다. [ERROR] Error deleting security group target binding while deleting security group : The specified network interface is not attached to any other security groups.

클러스터 프로비저닝에 실패하면 클러스터를 다시 프로비저닝하기 전에 실패한 프로비저닝에서 모든 리소스를 정리하는 것이 좋습니다.

제거 프로세스 중에 부트스트랩 노드는 프로비저닝 단계 중에 작성된 모든 자원을 정리하려고 시도합니다. 베어메탈 서버 프로비저닝이 예상보다 오래 걸리고 실패한 후 후속 정리 중에 영구 삭제 프로세스에서 실패한 베어메탈 서버가 영구 삭제하려는 보안 그룹에 여전히 연결되어 있다고 불평할 수 있습니다.

클러스터 접두부 이름을 복사하고 다음 단계를 완료하십시오.

  1. 보안 그룹으로 이동하여 -storage-sg에 액세스하십시오.

  2. 보안 그룹에 대해 첨부된 자원 섹션으로 이동하십시오.

  3. 연결된 베어메탈 서버를 클릭하고 서버의 ID를 복사하십시오.

  4. CLI에서 다음 명령을 실행하여 서버를 중지하고 삭제하십시오.

    ibmcloud is bare-metal-server-stop $bare_metal_server_id
    
    ibmcloud is bare-metal-server-delete $bare_metal_server_id
    

Bare Metal Server를 삭제하려면 몇 초가 걸립니다. 베어메탈 노드가 삭제되면 Schematics 로 이동하여 리소스 영구 삭제를 적용하십시오.

VPC및 서브넷 작성 중에 발생한 subnet_not_in_address_prefix 오류 또는 invalid CIDR format 오류는 무엇입니까?

작업공간에 계획을 적용하려고 할 때 다음 오류가 수신됩니다. Apply failed due to Error: [ERROR] Error while creating subnet. The specified CIDR does not fit in any of the address prefixes in the specified VPC. Make sure the subnet's CIDR is a subset of the CIDR of one of the address prefixes.

적용 계획 프로세스 중에 작업공간은 배치 값에서 지정된 범위의 CIDR 주소 접두부를 사용하여 VPC및 서브넷을 작성하려고 시도합니다. 주소 접두부 범위가 범위를 벗어나거나 VPC의 IP 주소 범위 제품군에 속하지 않으면 주소가 범위를 벗어남 오류가 발생합니다.

서브넷 작성을 위해 제공되는 주소 접두부 범위가 VPC에 사용되는 것과 동일한 주소 범위에 속하는지 유효성 검증하십시오. 예를 들어, VPC 주소 접두부가 10.241.0.0/18인 경우 서브넷은 10.241.x.x 범위에 있어야 합니다. 다른 IP 주소 범위가 사용되는 경우 서브넷을 나누고 서브넷 작성에 필요한 IP 주소 범위를 선택해야 합니다.

배치가 "프로세스가 상태 2로 종료됨" 오류 메시지와 함께 실패하는 이유는 무엇입니까?

작업공간에 계획을 적용하려고 할 때 다음 오류가 수신됩니다. Apply failed due to Error: Error: remote-exec provisioner error and error executing "/tmp/terraform_1756078506.sh": Process exited with status 2.

솔루션은 제공된 라이센스 번호가 유효한지 여부를 평가하는 로직으로 구현됩니다. 이 기능은 사용자 정의 이미지의 맨 위에 디자인되었으므로 배치가 완료될 때마다 제품 배치를 완료하는 데 필요한 패키지를 평가하고 복호화합니다. 이 기능이 없는 이미지가 사용되면 자동화 코드 오류가 발생합니다.

라이센스를 평가하고 패키지를 복호화하는 기능이 있는 솔루션 팀에서 제공하는 적절한 사용자 정의 이미지를 사용하십시오.

IBM Cloud Schematics 가 클러스터를 프로비저닝할 수 없고 Enabling the Custom resolver 오류로 실패하는 이유는 무엇입니까?

Schematics 가 VPC 리소스를 작성하려고 시도하는 동안 사용자 정의 분석기를 작성하려고 시도하지만 다음 오류로 실패합니다. [ERROR] Error Enabling the Custom resolver : MaxTimeout

Terraform은 사용자 정의 분석기 환경을 작성하려고 시도하고 사용자 정의 분석기 상태가 활성 상태에 도달할 때까지 대기합니다. 이 프로세스 중에 사용자 정의 분석기가 예상보다 많은 시간을 소요하는 경우 Terraform에서 오류 메시지가 발생합니다.

실패한 배치 후 모든 자원을 정리하십시오. 후속 시도 중에 새 클러스터 접두부를 사용하여 이전에 실패한 시도의 자원과 이름이 충돌하지 않도록 하십시오. 문제가 계속 발생하면 IBM Cloud 지원 센터에서 문제를 여십시오.

IBM Cloud Schematics 가 클러스터를 프로비저닝할 수 없고 비밀번호가 없는 SSH 오류로 실패하는 이유는 무엇입니까?

spectrum_scale_enabled 가 true로 설정된 경우 Schematics 가 모든 자원을 작성한 후 솔루션은 Ansible 코드를 트리거하여 스토리지 베어메탈 서버에서 전체 Scale 구성을 구성합니다. Ansible 구성 중에 다음 오류가 발생합니다. [ERROR] Check passwordless SSH on all scale inventory hosts (1 retries left)

모든 인프라 관련 자원이 시작되어 실행되면 Ansible 코드가 비밀번호 없는 SSH 메소드를 통해 스케일 구성을 수행하려고 시도합니다. 이 프로세스 중에 스토리지 베어메탈 서버에서 SSH 서비스가 실행 중 상태가 아닌 경우 Ansible 은 해당 특정 베어메탈 스토리지 노드에 SSH할 수 없으며 오류로 인해 실패합니다.

실패한 배치 후 모든 자원을 정리하십시오. 후속 시도 중에 새 클러스터 접두부를 사용하여 이전에 실패한 시도의 자원과 이름이 충돌하지 않도록 하십시오. 문제가 계속 발생하면 IBM Cloud 지원 센터에서 문제를 여십시오.

IBM Cloud Schematics 가 클러스터를 프로비저닝할 수 없고 nmmcrcluster 오류로 실패하는 이유는 무엇입니까?

spectrum_scale_enabled 가 true로 설정된 경우 Schematics 가 모든 자원을 작성한 후 솔루션은 Ansible 코드를 트리거하여 스토리지 베어메탈 서버에서 전체 Scale 구성을 구성합니다. Ansible 구성 중에 다음 오류가 발생합니다. [ERROR] nmmcrcluster: Error found while checking node descriptor

모든 인프라 관련 자원이 시작되어 실행되면 Ansible 코드가 비밀번호 없는 SSH 메소드를 통해 스케일 구성을 수행하려고 시도합니다. 이 프로세스 중에 스토리지 베어메탈 서버에서 베어메탈 구성 중 하나가 이전 destroy 명령에서 제대로 정리되지 않으면 오류가 표시될 수 있습니다.

실패한 배치 후 모든 자원을 정리하십시오. 후속 시도 중에 새 클러스터 접두부를 사용하여 이전에 실패한 시도의 자원과 이름이 충돌하지 않도록 하십시오. 문제가 계속 발생하면 IBM Cloud 지원 센터에서 문제를 여십시오.