HPC 클러스터 설정
선택한 구성 특성을 사용하여 HPC 클러스터를 배치하십시오.
아키텍처 개요 및 NFS 파일 시스템 설정
HPC 클러스터는 로그인 노드, 블록 스토리지 볼륨이 연결된 스토리지 노드, 1-3개의 LSF 관리 노드 및 다수의 LSF 작업자 노드로 구성됩니다.
-
로그인 노드는 점프 호스트로 제공되며 공용 IP 주소가 있는 유일한 노드입니다. 다른 노드에는 개인용 IP 주소만 있으며 이러한 노드에 도달하는 유일한 방법은 로그인 노드를 통하는 것입니다. 기본 LSF 관리 호스트에 로그인하여 LSF 관리 호스트에서 대부분의 조작을 수행할 수 있습니다. 기본적으로
lsfadmin
는 클러스터에서 작성된 유일한 사용자 ID입니다. SSH 비밀번호 없는 설정은 LSF 관리 호스트와 작업자 간에 구성됩니다. LSF 1차에서lsfadmin
사용자 ID를 사용하여 다른 작업자 노드에 도달할 수 있습니다. -
작업자 노드는 정적 리소스일 수 있습니다. 이 경우 해당 라이프사이클은 Schematics에 의해 관리됩니다. 다수의 정적 작업자 노드를 요청할 수 있으며 이러한 작업자는 Schematics-destroy 조치가 수행될 때까지 LSF 클러스터에서 사용 가능한 상태로 유지됩니다. LSF 자원 커넥터 기능은 작업을 실행하기에 충분한 용량이 없을 때 추가 작업자를 작성하고 수요가 감소할 때 작업자를 영구 삭제합니다. 이러한 동적 작업자의 라이프사이클은 LSF 자원 커넥터에 의해 관리됩니다. Schematics를 통해 전체 VPC 클러스터를 영구 삭제하기 전에 이러한 동적 리소스가 클라우드에 리턴될 때까지 기다리십시오.
-
IBM Cloud File Storage for VPC 는 파일 공유에 사용됩니다. 기본적으로 두 개의 파일 공유 볼륨이 있습니다. 각 볼륨은 100GB입니다. 이 구성을 변경하려면 custom_file_shares 배치 값을 설정 하십시오.
HPC 클러스터 솔루션은 LSF 설치를 포함하는 기본 사용자 정의 이미지를 제공합니다. 기본 이미지 위에 사용자 정의 이미지를 작성할 수 있습니다. 자세한 정보는 사용자 정의 이미지 작성 을 참조하십시오. VPC의 이미지 서비스는 이를 수행하는 방법을 제공합니다. 그런 다음 LSF 관리 노드 및 작업자 노드에 대해 Schematics 에서 사용할 사용자 정의 이미지를 지정할 수 있습니다. 로그인 노드 및 스토리지 노드에서 사용하는 이미지는 현재 구성할 수 없습니다 (기본적으로CentOS 7).
SSH 키 작성
SSH키를 작성하려면 다음 단계를 완료하십시오.
-
다음 명령을 실행하여 시스템에서 SSH키를 생성하십시오.
ssh-keygen -t rsa
-
.ssh/id_rsa.pub
에서 모든 컨텐츠를 복사하고 저장하십시오.
VPC 인프라에 SSH키 추가
- 고유 인증 정보를 사용하여 IBM Cloud® 콘솔 에 로그인하십시오.
- 대시보드에서 메뉴 아이콘
> VPC 인프라 > SSH키를 클릭하십시오.
- 작성을 클릭하십시오.
- SSH키 이름 (예:
po-ibm-ssh-key
) 을 입력하고, 기본 리소스 그룹을 선택하고, 태그를 추가하고, 지역을 선택하십시오. - 공개 키 필드 (
.ssh/id_rsa.pub
에서 저장한 컨텐츠) 에 공개 키를 복사하여 붙여넣으십시오. - SSH 키 추가를 클릭하십시오.
API 키 작성
API키를 작성하려면 다음 단계를 완료하십시오.
- IBM Cloud 콘솔에서 관리 > 액세스 (IAM) > API키로 이동하십시오.
- IBM Cloud API 키 작성을 클릭하십시오.
- API 키의 이름과 설명을 입력하십시오.
- 작성을 클릭하십시오.
- 그런 다음 표시 를 클릭하여 API키를 표시하거나 복사 를 클릭하여 나중에 복사하고 저장하거나 다운로드를 클릭하십시오.
IBM Cloud 카탈로그에서 HPC 클러스터 작성 및 구성
IBM Cloud 카탈로그에서 HPC 클러스터를 작성하고 구성하려면 다음 단계를 완료하십시오.
-
IBM Cloud 카탈로그에서 HPC 또는 _Spectrum LSF_를 검색한 후 IBM Spectrum LSF 를 선택하십시오.
HPC 클러스터 솔루션 페이지 -
배치 값 설정 섹션에서 필수 값 (
api_key
,ibm_customer_number
,remote_allowed_ips
,ssh_key_name
및zone
) 을 제공하십시오. -
라이센스 계약을 확인한 후 다른 매개변수의 기본값을 사용하고 설치를 클릭할 수 있습니다. HPC 클러스터가 작성되고 기본 구성으로 5분내에 완료됩니다.
클러스터 배치를 위한 매개변수
HPC 클러스터에 대해 구성할 수 있는 매개변수 목록은 다음 표를 참조하십시오.
매개변수 | 설명 |
---|---|
cluster_prefix |
HPC 클러스터를 빌드하기 위해 프로비저닝되는 VPC 리소스의 이름을 지정하는 데 사용되는 접두어입니다. 단일 지역이 제공된 동일한 클라우드 계정에서 이름이 고유해야 하는 리소스가 있습니다. 이름이 고유한지 확인하십시오 (예: po-hpc-cluster 이름에 이니셜 추가). |
hyperthreading_enabled |
이 값을 true (기본값) 로 설정하여 클러스터의 작업자 노드에서 하이퍼 스레딩을 사용으로 설정할 수 있습니다. 그렇지 않으면 하이퍼 스레딩이 사용 안함으로 설정됩니다. |
image_name |
LSF를 사용하여 사용자 정의 이미지를 편집하고 추가하십시오. 솔루션에서 제공하는 기본 LSF 사용자 정의 이미지를 사용할 수 있습니다. 사용자 정의 이미지를 작성한 경우 사용자 정의 이미지의 이름으로 값을 편집하십시오. |
management_node_count |
클러스터에는 최대 세 개의 관리 노드가 있을 수 있습니다. LSF에서 제공하는 장애 복구 지원을 원하는 경우 값을 1보다 크게 지정해야 합니다. 이 경우 기본 관리 노드가 작동 중지되면 후보 관리 노드 중 하나가 기본 관리 노드가 되고 클러스터는 중단 없이 작동 상태로 유지됩니다. |
region |
클러스터를 작성할 지역을 편집하십시오. 지역의 전체 목록을 가져오려면 다른 지역에서 VPC 작성 을 참조하십시오. |
resource_group |
VPC 리소스가 배치된 IBM Cloud 계정의 리소스 그룹 이름입니다. |
vpc_name |
클러스터 리소스가 프로비저닝되는 기존 VPC를 사용할 수 있습니다. 값이 제공되지 않으면 클러스터에 대해 새 VPC가 프로비저닝됩니다. |
vpn_enabled |
클러스터에서 VPC용 VPN 게이트웨이를 배치할 수 있습니다. 기본적으로 이 값은 false로 설정됩니다. |
vpn_peer_address |
VPN이 연결된 피어 공용 IP 주소입니다. |
vpn_peer_cidrs |
VPN이 연결된 피어 CIDR의 쉼표로 구분된 목록입니다 (예: 192.168.0.0/24). |
vpn_preshared_key |
VPN의 사전 공유 키입니다. |
zone |
선택한 지역을 기반으로 구역을 편집합니다. 지역 내 구역의 전체 목록을 가져오려면 CLI를 사용하여 구역 가져오기 를 참조하십시오. |
자동 스케일링을 위한 매개변수
자동 스케일링을 위해 다음 매개변수를 설정할 수 있습니다.
-
worker_node_min_count
: 클러스터가 작성될 때 프로비저닝되고 클러스터의 작업 요구사항에 관계없이 실행 중인 상태로 유지되는 최소 작업자 노드 수입니다. -
worker_node_max_count
: HPC 클러스터에 추가할 수 있는 시스템 수를 제한하는 HPC 클러스터의 최대 작업자 노드 수입니다. LSF 자동 스케일링은 워크로드에 필요한 경우 클러스터를 이 노드 수까지 스케일링 업하고 큐에 작업이 없는 경우worker_node_min_count
작업자만 유지하도록 스케일링 백합니다.
인스턴스 프로파일의 매개변수
xxx_node_instance_type
매개변수를 통해 각 인스턴스 유형에 대한 인스턴스 프로파일을 제어할 수 있습니다. 관리 노드는 기본 LSF 디먼이 실행 중인 위치입니다. 100개이상의 노드를 사용하여 작업을 실행하려는 경우 더 많은 계산 능력이 있는 노드를 선택해야 합니다. 작업자 노드는 워크로드 실행이 발생하는 노드이며 워크로드의 특성에 따라 선택해야 합니다. 스토리지 노드는 HPC 클러스터의
NFS 파일 시스템을 관리하는 노드입니다. 로그인 인스턴스는 점프 호스트로 제공되므로 가장 작은 프로파일을 선택할 수 있습니다. 자세한 정보는 인스턴스 프로파일을 참조하십시오.
블록 볼륨의 매개변수
volume_xxx
매개변수를 사용하여 스토리지 용량 및 처리량을 구성할 수 있습니다. volume_profile
매개변수의 값은 범용 또는 사용자 정의일 수 있습니다. general-purpose
가 사용되는 경우 IOPS는 클라우드 인프라에 의해 판별되며 volume_iops
매개변수는 영향을 미치지 않습니다. IOPS를 사용자
정의하려면 volume_profiles
에 대해 사용자 정의를 사용하고 volume_capacity
에 지정된 용량을 기반으로 volume_iops
를 통해 IOPS를 설정해야 합니다. 자세한 정보는 블록 스토리지 프로파일 을 참조하십시오.
HPC 클러스터에 액세스
HPC 클러스터에 액세스하려면 다음 단계를 완료하십시오.
-
메뉴 아이콘
> 활동 > 적용된 계획 > 로그 보기로 이동하십시오.
-
ssh-command
를 복사하여 클러스터에 액세스하십시오.-
ssh -J root@ip-jumphost lsfadmin@ip-managementhost
-
ip-jumphost
은public
인 반면,ip-managementhost
는 그렇지 않습니다. -
-J flag
: 점프 호스트에 연결하고 최종 대상 (관리 호스트) 에 TCP 전달을 설정합니다.
-
자동 스케일링
최소 수의 작업자 노드 (worker_node_min_count
) 가 있습니다. 클러스터가 작성될 때 프로비저닝되는 작업자 노드의 수입니다. 그러나 worker_node_max_count
에서 정의한 Spectrum LSF 클러스터에 추가해야 하는 최대 작업자 노드 수를 사용할 수 있습니다. 이는 자동 스케일링 구성이 사용될 때 Spectrum LSF 클러스터에 추가할 수 있는 머신
수를 제한하기 위한 것입니다. 이 특성을 사용하여 Spectrum LSF 클러스터 인스턴스와 연관된 비용을 관리할 수 있습니다.
다음 예제는 worker_node_min_count=2
및 worker_node_max_count=10
를 표시합니다.
-
두 개의 작업자 노드를 확인하려면 다음 명령을 실행하십시오.
bhosts -w
출력 예:
두 개의 작업자 노드 -
자동 스케일링 기능을 시도하려면 세 개 이상의 노드가 필요한 작업을 실행하십시오. 예를 들어, 이 작업에는 10초동안 휴면 상태에 있는 5개의 작업이 필요합니다.
bsub -n 5 -R "span[ptile=1]" sleep 10
-
작업이 제출됩니다.
-
1분후에 다음 명령을 실행하여 노드를 확인하십시오.
bhosts -w
이제 5개의 노드가 클러스터에 추가되었음을 확인할 수 있습니다.
다섯 개의 작업자 노드가 추가됨 -
자동 스케일링 기능으로 작성된 노드의 차이는 10분이 사용되지 않으면 자동으로 영구 삭제됩니다.
워크로드에 맞게 HPC 클러스터 사용자 정의
클러스터에서 워크로드에 대한 소프트웨어 패키지를 추가하는 두 가지 옵션이 있습니다. 모든 계산 노드에 표시되는 NFS 공유 파일 시스템 (예: LSF 관리 호스트의 /home/lsfadmin/shared
) 에 추가 소프트웨어를 설치할 수 있습니다. NSF 공유 파일 시스템에 추가하는 파일은 스토리지 노드에 연결된 블록 스토리지에 저장됩니다. 전체 HPC 클러스터가 영구 삭제되면 데이터가 유실됩니다. 클러스터를
영구 삭제하기 전에 보존할 데이터를 저장해야 합니다.
다른 옵션은 HPC 클러스터 솔루션에서 사용하는 기본 이미지 위에 사용자 정의 이미지를 빌드하는 것입니다. HPC 클러스터를 작성하기 전에 사용자 정의 이미지 작성을 준비해야 합니다. 새 사용자 정의 이미지가 VPC에서 작성되면 이름이 이 이미지와 연관됩니다. image_name
매개변수에서 이 이름을 사용해야 합니다. 자세한 정보는 기본 이미지 확장 및 새 사용자 정의 이미지 작성을 참조하십시오.
(선택사항) 하이브리드 연결 설정
VPN을 사용하여 하이브리드 연결 환경을 설정하려면 HPC 클러스터에 VPN 설치 지시사항을 참조하십시오.
Direct Link를 사용하려면 HPC 클러스터에 Direct Link 설치 에 대한 지시사항을 참조하십시오.
IBM Spectrum LSF 와 함께 OpenLDAP 사용
IBM Spectrum LSF의 OpenLDAP 에 대해 자세히 알려면 IBM Spectrum LSF 를 사용한 OpenLDAP 정보 의 내용을 참조하십시오.
배치 중에 enable_ldap
,ldap_basedns
, ldap_server
, ldap_admin_password
, ldap_user_name
및 ldap_user_password
배치 입력 값을 설정하여 IBM Spectrum LSF 클러스터와 함께 OpenLDAP 를 사용으로 설정합니다.
OpenLDAP 를 IBM Spectrum LSF 클러스터와 통합하는 방법에 대해 자세히 알려면 OpenLDAP 를 IBM Spectrum LSF 클러스터와 통합 을 참조하십시오.
DNS 구역 및 DNS 사용자 정의 분석기 작성
dns_instance_id
배치 입력 값을 널 (null) 로 두면 배치 프로세스가 각 DNS 구역에 새 DNS 서비스 인스턴스 ID를 작성합니다. 또는 dns_instance_id
배치 입력 값에 대해 기존 IBM Cloud® DNS 서비스 인스턴스 ID 를 제공하십시오.
dns_custom_resolver_id
배치 입력 값을 널로 두면 배치 프로세스에서 새 VPC를 작성하고 클러스터에 대해 새 사용자 정의 분석기를 사용으로 설정합니다. 또는 기존 VPC를 사용하여 DNS 사용자 정의 분석기를 작성하려면 dns_custom_resolver_id
배치 입력 값에 대한 분석기 ID를 제공하십시오. 자세한 정보는 IBM Spectrum LSF 클러스터의 DNS 사용자 정의 분석기 를 참조하십시오.
IBM Key Protect 인스턴스를 사용하여 데이터 암호화 관리
가상 서버 인스턴스에 대한 데이터 암호화를 관리하려면 IBM Spectrum LSF 클러스터를 통해 IBM Key Protect 인스턴스를 사용하십시오. Key Protect 및 암호화 키에 대한 자세한 정보는 IBM® Key Protect 및 암호화 키 를 참조하십시오.