IBM Cloud Docs
トラブルシューティング

トラブルシューティング

IBM Cloud Schematics がプライベート GitHub リポジトリーを複製できないのはなぜですか?

Schematics はプライベート GitHub リポジトリーを複製できず、次のエラー・メッセージが表示されます。 Failed to clone git repository, repository not found (check url, also check the scope 'repo' of the personal access token if SCHEMATICSGITTOKEN is used)

正しい GitHub トークンを指定しなかったか、 GitHub トークンを完全に指定しませんでした。

GitHub トークン を指定し、ワークスペース作成 API の github_token パラメーターに正しい GitHub トークンが指定されているかどうかを確認します。

IBM Cloud Schematics がパブリック GitHub リポジトリーを複製できないのはなぜですか?

Schematics はパブリック GitHub リポジトリーを複製できず、以下のいずれかのエラー・メッセージが表示されます。

  • Fatal, could not download repo, Failed to clone git repository, authentication required (or the git url is incorrect). Problems found with the Repository. Please Rectify and Retry
  • Template error: Failed to clone git repository, authentication required (or the git url is incorrect)

正しい GitHub URL を指定しなかったか、 GitHub トークンを指定しました。これは、パブリック・リポジトリーの複製には必要ありません。 GitHub アクセス・トークンは、プライベート・リポジトリーにアクセスするためにのみ必要です。

GitHub トークンを指定しないでください。また、パブリック・リポジトリーを使用してワークスペースを作成するときに、 github_token パラメーターで GitHub トークンが指定されているかどうかを確認してください。

IBM Cloud Schematics がワークスペースを作成できないのはなぜですか?

Schematics がワークスペースを作成できず、次のエラー・メッセージが表示されます。 You don't have the required to create a workspace in any resource groups. You must be assigned the manager role on the Schematics service in at least one resource group. Contact your account administrator for access.

リソース・グループ内にワークスペースを作成するために必要なアクセス権限がありません。 少なくとも 1 つのリソース・グループの Schematics サービスに対する管理者役割を割り当てられている必要があります。

アカウント管理者に連絡して、少なくとも 1 つのリソース・グループで Schematics サービスに対するマネージャー役割が割り当てられていることを確認してください。

IBM Cloud Schematics がクラスターをプロビジョンできず、 lsf_license_confirmation 変数のエラー・メッセージで失敗するのはなぜですか?

Schematics がクラスターをプロビジョンできず、次のエラー・メッセージが表示されます。 Error: Invalid value for variable "lsf_license_confirmation"

プロパティー lsf_license_confirmation に「true」以外の値が入力されました。

プロパティー lsf_license_confirmation は、有効な値として「true」のみを受け入れます。 「true」の値は、以下の 2 つの条件のいずれかに同意したことを示します。

  1. 実動クラスターをデプロイする場合は、 IBM Cloud に IBM Spectrum LSF をデプロイするための十分なライセンスがあること、およびこれらのライセンスが IP{site.data.keyword.cloud_notm の下で使用許諾されていることを確認しました。
  2. IBM Cloud に IBM Spectrum LSF を使用して評価クラスターをデプロイし、プログラム評価のためのご使用条件 (ILAE) に従うことに同意します。

IBM IPLA と ILAE の両方のソフトウェア使用条件については、 こちらを参照してください。

2 つの条件のいずれかに同意した後、プロパティー値を「true」に更新し、再試行してください。

IBM Cloud Schematics がクラスターをプロビジョンできず、許可エラーで失敗するのはなぜですか?

Schematics がクラスターをプロビジョンできず、次のエラー・メッセージが表示されます。 Request is not authorized. Check your user permissions and authorizations and try again.

VPC リソースをプロビジョンするために必要なアクセス権限がありません。

アカウント管理者に連絡して、必要なアクセス権限をすべて取得してください。 詳しくは、 必要な権限 を参照してください。

IBM Cloud Schematics がクラスターをプロビジョンできず、指定された名前が固有でないというエラーで失敗するのはなぜですか?

Schematics がクラスターをプロビジョンできず、以下のサンプル・エラー・メッセージが表示されます。

"code": "validation_unique_failed",
"message": "Provided Name (sample-lsf-vpc) is not unique",
"target": {
"name": "name",
"type": "field",
"value": "sample-lsf-vpc"
}

VPC リソース名は固有でなければなりません。 同じ名前のリソースが存在する場合、同様のエラーが発生する可能性があります。

既存のリソースをプロビジョン解除して、再試行してください。

IBM Cloud Schematics がカスタム・イメージを使用してクラスターをプロビジョンできないのはなぜですか?

カスタム・イメージを使用しているときに、 Schematics がクラスターをプロビジョンできず、以下のいずれかのエラー・メッセージが表示されます。

  • The arugment "image" is required, but no definition was found.
  • Unknown variable. There is no variable named "image_id".

仮想サーバー・インスタンスの 1 つに使用されるカスタム・イメージがターゲットのリージョンとゾーンに存在しないか、クラスターのプロビジョンに使用されるアカウントと API キーによってアクセスできません。

いずれかの仮想サーバー・インスタンスにカスタム・イメージを使用している場合は、そのカスタム・イメージがターゲットのリージョンとゾーンで使用可能であり、クラスターのプロビジョンに使用されるアカウントと API キーによってアクセス可能であることを確認してください。

リフレッシュ・トークンに関するエラーが表示されるのはなぜですか?

計画の生成計画の適用、および リソースの破棄 要求でリフレッシュ・トークン・エラーを受け取ります。 Error: The provided Refresh Token is invalid. Please provide a proper refresh token for Terraform to run the configuration. Code: 400

正しいリフレッシュ・トークンを指定しなかったか、またはリフレッシュ・トークンを完全に指定しませんでした。

curl コマンドを使用して生成されたリフレッシュ・トークンが正しいかどうかを確認してください。正しくない場合は、リフレッシュ・トークンを再生成してください。

ワークスペースに変更を適用するとエラーが表示されるのはなぜですか?

ワークスペースに変更を適用しようとすると、次のエラーが表示されます。 Apply failed due to "Error: Error Deleting Volume : The volume is still attached to an instance."

ボリューム・プロファイル、容量、または IOPS を再構成した後、変更を適用する前にワークスペースをクリーンアップする必要があります。

既存のリソースを破棄して、変更の適用を再試行する必要があります。 既存のリソースを破棄すると、ストレージ・ノード上のデータは削除されます。

SSH の問題でクラスターの作成が失敗するのはなぜですか?

Ansible プロビジョナーがワーカー・ノードとストレージ・ノードのリソースで Storage Scale 関数をセットアップしようとすると、以下のエラー・メッセージが表示されます。

  • msg": "Failed to connect to the host via ssh, Connection closed by UNKNOWN port 65535", "unreachable": true}
  • Error: Failed to connect to the host via ssh: Connection timed out during banner exchange", "unreachable

Schematics はインフラストラクチャー・リソースをデプロイしますが、自動化コードはいくつかの Ansible プレイブックを使用して構成されます。これらのプレイブックは、 Ansible を利用して仮想サーバー・インスタンス・ノード上で Storage Scale 機能をセットアップするために必要です。 Ansible プロビジョナーが Storage Scale 機能を使用するためにこれらのノードに SSH で接続しようとすると、ノードは unreachable 状態になります。

この問題を修正するには、以下のようにします。

  1. ワークスペースからのリソースの破棄を試行し、再度デプロイしてください。
  2. すべてのデプロイメントでこの問題が発生した場合は、 IBM Cloud サポート・チームにサポート問題を報告して、インフラストラクチャーの問題があるかどうかを調査してください。
  3. インフラストラクチャーに問題がない場合は、さらに調査できる自動化チームにこの問題を報告してください。

認証またはタイムアウトの問題が原因でリソース・エラーが表示されるのはなぜですか?

特定のリソースの作成中に、以下のエラー・メッセージが表示されます。

  • Error: An error occurred while performing the ‘authenticate’ step: Post “https://iam.cloud.ibm.com/identity/token”: context deadline exceeded (Client.Timeout exceeded while awaiting headers)
  • Error: timeout while waiting for state to become 'done, ' (last state: 'provisioning', timeout: 10m0s)

Schematics は、インフラストラクチャー・リソースをデプロイしますが、API 呼び出しを介して IBM Cloud で認証を行います。 クラウド環境に対する API を介した要求が多すぎる場合、 Schematics は認証できず、認証エラーでエラーになる可能性があります。

いずれかの問題 (認証エラーまたはタイムアウト・エラーが原因でリソースが失敗する) を修正するには、 Schematics ワークスペースからリソースを破棄し、リソースのデプロイを再試行してください。

専用ホストで使用可能なプロファイルの制限

このオファリングは、専用ホストのインスタンス・プロファイルを、ワーカー・インスタンス (worker_node_instance_type) のプロファイルと同じ接頭部 (例えば、 bx2 および cx2) になるように自動的に選択します。 ただし、使用可能なインスタンス接頭部は、ターゲット・リージョンによって制限される場合があります。 専用ホストを使用する場合は、 ibmcloud target -r {region_name} および ibmcloud is dedicated-host-profiles を調べて、 worker_node_instance_type にターゲット領域に使用可能な接頭部があるかどうかを確認してください。

指定された ssh_key_name 値でエラーを受け取るのはなぜですか?

Schematics ワークスペースで計画を生成または適用しようとすると、次のエラーが表示されます。 failed due to "Error: No SSH Key found with name <KEY_NAME>".

Terraform は、指定された SSH 鍵の名前を検出できませんでした。

  1. 指定された SSH 鍵が、クラスターがプロビジョンされている現在のリージョンに存在するかどうかを確認します。 指定された SSH 鍵が存在しない場合は、現在のリージョンに SSH 鍵を作成します。
  2. 複数の SSH 鍵を構成する際には、SSH 鍵名の前後に空白文字が追加されていないことを確認してください。
  3. 複数の SSH 鍵を使用している場合は、SSH 鍵の間の区切り文字としてコンマ (,) が使用されているかどうか、および SSH 鍵の前後に空白文字が追加されていないかどうかを確認してください。

クラスター・デプロイメント中に remote-exec provisioner error が表示されるのはなぜですか?

次のようなエラーが発生します。

2023/10/30 08:09:30 Terraform apply | module.check_cluster_status.null_resource.remote_exec[0] (remote-exec): ls_gethostinfo(): Cannot locate master LIM now, try later
2023/10/30 08:09:30 Terraform apply | module.check_cluster_status.null_resource.remote_exec[0] (remote-exec): lsid: ls_getentitlementinfo() failed: Cannot locate master LIM now, try later
2023/10/30 08:09:30 Terraform apply |
Error: remote-exec provisioner error

Schematics がインフラストラクチャー・リソースをデプロイすると、クラスター・ノードの正常性が自動的に検証され、必要なすべての構成が適切に設定されていることが確認されます。 まれに、LSF が LIM 構成を検出できないため、管理ノード上で LIM デーモンを開始できないことがあります。

LSF 管理ノードが LIM 状況を取得するのに時間がかかることがあります。そのため、しばらく待ってから確認してください。 ただし、問題が解決しない場合は、 Schematics からクラスターを破棄して再適用してください。

クラスター・デプロイメント中に IBM Cloud® Secrets Manager を使用するとエラーが表示されるのはなぜですか?

セキュアなデプロイメント入力値に IBM Cloud® Secrets Manager を使用すると、以下のようなエラーが発生します。

Unable to validate your configuration.
An error occurred when fetching secret from Secrets Manager. Reason: Error: Cannot find the secret de132a21-7d64-d63f-c77a-c86e9cd50d17 from secrets manager crn:v1:bluemix:public:secrets-manager:us-east:a/ec1b082b25144a52bb1a269c883d5a00:94e42547-ab61-4ce1-b7f1-d96b230a75eb::

Secrets Managerから ユーザー資格情報 タイプのシークレットを読み取るときに、 IBM Cloud® プロジェクトに関する既知の問題があります。

Secret Manager ですべてのユーザー資格情報タイプのシークレットを 任意の タイプのシークレットに変更し、デプロイメントを再試行します。

LDAP ユーザーが見つからないのはなぜですか?

su コマンドを使用して LDAP ユーザーに切り替えようとすると、そのユーザーが存在しないことを示すエラーが表示されます。 エラー・メッセージの例を以下に示します。

[lsfadmin@lsfuser05-ubuntu-two-mgmt-1 ~]$ su lsfuser05
su: user lsfuser05 does not exist
[lsfadmin@lsfuser05-ubuntu-two-mgmt-1 ~]

このエラーは、指定された LDAP ユーザー (この場合は lsfuser05 ) が LDAP サーバーで見つからないために発生します。 LDAP ユーザーが作成されていないか、LDAP ディレクトリーで使用できない可能性があります。

ldapsearch コマンドを使用して、 ユーザーが存在することを確認 します。 ユーザーが存在しない場合は、 ユーザーを作成します

LDAP ユーザー認証が失敗するのはなぜですか?

su コマンドを使用して LDAP ユーザーに切り替えようとすると、システムがユーザーを認証できないというエラーが表示されます。 エラー・メッセージの例を以下に示します。

[lsfadmin@lsfuser05-ubuntu-two-mgmt-1 ~]$ su lsfuser05
Password:
su: Authentication failure
[lsfadmin@lsfuser05-ubuntu-two-mgmt-1 ~]$

認証の失敗は、指定された LDAP パスワードが正しくないことを示しています。

LDAP パスワードをリセットします。

  1. Schematics ログ出力から ssh_to_ldap_node コマンドを使用して SSH 経由で OpenLDAP サーバーに接続し、root ユーザーに切り替えます。

    ssh -o StrictHostKeyChecking=no -o UserKnownHostsFile=/dev/null -o ServerAliveInterval=5 -o ServerAliveCountMax=1 -J vpcuser@<floatingg_IP_address> ubuntu@<LDAP_server_IP>
    

    ここで、 <floating_IP_address> は bastion ノードの浮動 IP アドレス、 <LDAP_server_IP> は OpenLDAP ノードの IP アドレスです。

  2. ldappasswd コマンドを使用して、パスワードをリセットします。 このコマンドを使用すると、指定した LDAP ユーザーの新規パスワードを設定できます。 識別名 (DN) とユーザーの詳細を、ご使用の LDAP セットアップ用の正しい値に置き換えてください。 以下に、ユーザー・パスワードをリセットする例を示します。

    ubuntu@<LDAP_server_IP>:~$ ldappasswd -x -D "cn=admin,dc=hpcaas,dc=com" -W -S "uid=lsfuser05,ou=People,dc=hpcaas,dc=com"
    New password:
    Re-enter new password:
    Enter LDAP Password:
    ubuntu@anand-ga-ldap-1:~$
    

ホスト短縮名を使用して SSH 接続が確立されないのはなぜですか?

NetworkManager がドメイン名を取得していないため、以下のエラー・メッセージが表示されます。

[root@user-lsf-test1-mgmt-2 ~]# nslookup user-scale-spectrum-storage-1
Server: 10.241.0.15
Address: 10.241.0.15#53
** server can't find user-scale-spectrum-storage-1: NXDOMAIN

or

[lsfadmin@user-lsf-test1-mgmt-2 ~]$ ssh user-lsf-test1-mgmt-1
ssh: Could not resolve hostname mani-lsf-basic-login: Name or service not known

このエラーが発生するのは、DNS ドメインおよびカスタム・リゾルバーを構成した後、RHEL ベースのシステムが NetworkManager サービスを使用して、 /etc/resolv.conf ファイル内の検索でドメイン・ネームを選出し、実際のドメイン・ネームに依存せずにホストのショート・ネームを解決するためです。

この問題を解決するには:

  1. root (sudo su) として移動します。
  2. Run systemctl restart NetworkManager コマンドを実行します。

上記のコマンドが /etc/resolv.conf ファイルで実行依頼されたら、以下に示すように、ドメイン名を使用して検索を更新する必要があります。

[lsfadmin@user-lsf-test1-mgmt-2 ~]$ cat /etc/resolv.conf

Generated by NetworkManager

search lsf.com
nameserver 10.241.0.10