クラスターの正常性のモニタリング

クラスター・メトリックとアプリのモニタリングを目的として、Red Hat® OpenShift® on IBM Cloud® クラスターには単一のクラスター・インスタンスの正常性を管理するのに役立つ組み込みツールが備わっています。また、 IBM Cloud Kubernetes Service クラスタアドオン: IBM Cloud Logs および IBM Cloud Monitoring のように、マルチクラスタ分析やその他のユースケースのために IBM Cloud ツールをセットアップすることもできます。

モニタリングのオプションについて

以下の情報を参考にして、組み込みの Red Hat OpenShift ツールと IBM Cloud 統合を状況に応じて使い分けてください。

RHCOS ワーカー・ノードを使用するプライベート専用クラスターでのモニター制限: モニター・エージェントはオペレーティング・システムのカーネル・ヘッダーに依存していますが、RHCOS にはカーネル・ヘッダーがありません。このシナリオでは、エージェントは sysdig.com に戻り、プリコンパイルされたエージェントを使用します。パブリック・ネットワーク・アクセスがないクラスターでは、このプロセスは失敗します。 RHCOS クラスターでのモニターを可能にするには、アウトバウンド・トラフィックを許可するか、エアギャップ環境へのエージェントのインストールに関する Sysdig 資料を参照する必要があります。

IBM Cloud Monitoring

IBM Cloud Monitoring に関する以下の詳細情報を確認してください。

クラスター・メトリック、コンテナー・セキュリティー、リソース使用量、アラート、およびカスタム・イベントを統合して表示できるカスタマイズ可能なユーザー・インターフェース。
スクリプトを使用したクラスターとの迅速な統合。
クラスターとクラウド・プロバイダーをまたいだメトリックの集約およびコンテナーのモニタリング。
タイムラインとプランに応じた履歴メトリックの利用、およびトレース・ファイルのキャプチャーとダウンロードの機能。
高可用性、拡張容易性、および業界のセキュリティー標準に対する準拠。
IBM Cloud の IAM との統合によるユーザー・アクセス管理。

組み込みの Red Hat OpenShift モニタリング・ツール

OpenShift には、クラスターごとにコア・プラットフォーム・コンポーネントのモニターを提供する、事前構成、プリインストール、および自己更新のモニター・スタックが含まれています。このモニタリングには、クラスター・メトリック用の openshift-monitoring プロジェクトの Prometheus および Grafana デプロイメントが組み込まれています。これらは単一ゾーンでのみ使用可能です。 Red Hat OpenShift Web コンソールから、モニター・ダッシュボード、メトリック、およびアラートを表示および管理できます。詳しくは、 Red Hat OpenShift 資料の Monitoring を参照してください。

デフォルトでは、モニタリングスタックはメトリック履歴のバックアップに永続ストレージを使用せず、代わりにホストファイルシステム内の一時的な EmptyDir ボリュームを使用します。メトリック履歴の保存期間は、クラスターのバージョンに応じて 11 日から 15 日の範囲になります。一部のワークロードでは、これらの設定によって大量のディスク・スペースとメモリーが使用されたり、メトリック保存の要件が満たされなかったりする可能性があります。永続ストレージを使用するようにモニター・スタックを構成したり、メトリック保存ポリシーを変更したり、専用ノードで Prometheus を実行したりすることができます。詳細については、監視スタックの設定を参照してください。

Red Hat OpenShift on IBM Cloud version 4.16 では、デフォルトで10 GBのサイズ保持が設定されていることに注意してください。

Red Hat® OpenShift® on IBM Cloud® ストレージ・メトリックのモニター

Red Hat® OpenShift® on IBM Cloud® クラスターには、クラスター管理者がストレージ・ボリュームの可用性と容量に関する情報を取得するのに役立つツールが組み込まれています。

Red Hat OpenShift モニター・ダッシュボードでストレージ・メトリックを表示できない場合は、 Block Storage for VPC メトリックのデバッグを参照してください。

Red Hat® OpenShift® on IBM Cloud® クラスターについて、以下のメトリックをモニターできます。

kubelet_volume_stats_available_bytes
kubelet_volume_stats_capacity_bytes
kubelet_volume_stats_inodes
kubelet_volume_stats_inodes_free
kubelet_volume_stats_inodes_used

E メールや Slack などのプラットフォームのストレージ・モニター・アラートをセットアップする必要がありますか? Red Hat OpenShift 資料の「外部システムへの通知の送信」を参照してください。

Block Storage for VPC のメトリックを監視するには、 Block Storage for VPC クラスタアドオンを有効にしたクラスタが必要で、ワーカーノードに Block Storage for VPC ボリュームがアタッチされている必要があります。 Red Hat® OpenShift® on IBM Cloud® ストレージ・メトリクスは、マウントされたストレージ・ボリュームに対してのみ入力されます。

Red Hat OpenShift Web コンソールにナビゲートし、**「モニタリング」を選択してから「メトリック」**を選択します。

ダイアログボックスに監視したいメトリックを入力し、 Run queriesを選択します。

kubelet_volume_stats_used_bytes{persistentvolumeclaim="NAME OF PVC"} / kubelet_volume_stats_capacity_bytes{persistentvolumeclaim="NAME OF PVC"}

出力例

endpoint       instance      job     metrics_path  namespace  node         persistentvolumeclaim  prometheus               service  value
https-metrics  11.111.1.1:XX kubelet /metrics      default    11.111.1.1   PVC-NAME               openshift-monitoring/k8s kubelet  0.003596851526321722

詳しくは、モニターを参照してください。

ボリュームが容量に達している場合は、ボリューム拡張のセットアップを試してください。

ログ収集および監視エージェントをCloud Logsに移行する

observability CLI プラグイン ibmcloud ob と v2/observe エンドポイントはサポートされなくなりました。直接的な代替品はありませんが、コンソールまたは Helm のチャートから、ロギングとモニタリングの統合を管理できるようになりました。最新のステップについては、「 Red Hat OpenShift on IBM Cloud クラスターのログ収集エージェントの管理」および「 Red Hat OpenShift モニタリングエージェントの使用」を参照してください。

ob プラグイン、Terraform、またはAPIを使用して、クラスタに監視エージェントをインストールしたり、既存の構成を変更したりすることはできなくなりました。 Sysdig エージェントは引き続き、指定された IBM Cloud Monitoring インスタンスにメトリクスを送信します。 LogDNA IBM Cloud Log Analysis がに置き換えられたため、エージェントはログを送信できなくなりました。 IBM Cloud

観測エージェントの確認

observability プラグインは、Sysdig と LogDNA エージェントを ibm-observe ネームスペースにインストールする。

Red Hat OpenShift クラスターにアクセスします。

ibm-observe 名前空間のコンフィグマップを確認します。

kubectl get cm -n ibm-observe

Example output

NAME                                   DATA   AGE

e405f1fc-feba-4350-9337-e7e249af871c   6      25m

f59851a6-ede6-4719-afa0-eee7ce65eeb5   6      20m

ObservabilityプラグインによってインストールされたObservabilityエージェントは、ログまたはメトリクスが送信される IBM Cloud Monitoring インスタンスまたは IBM Cloud Log Analysis インスタンスのGUIDを持つconfigmapを使用します。クラスタに ibm-observe 以外のネームスペースにエージェントがある場合、または ibm-observe の configmaps にインスタンス GUID の名前が付けられていない場合、これらのエージェントは IKS observability (ob) プラグインと共にインストールされていません。

観測用プラグインエージェントの削除

デーモンセットとコンフィグマップをクリーンアップする。

kubectl delete daemonset logdna-agent -n ibm-observe
kubectl delete daemonset sysdig-agent -n ibm-observe
kubectl delete configmap <logdna-configmap> -n ibm-observe
kubectl delete configmap <sysdig-configmap> -n ibm-observe

オプション：名前空間を削除します。その名前空間で実行中のリソースが他にない場合。
```
kubectl delete namespace ibm-observe
```

プラグインが削除された後、クラスタダッシュボード、Terraform、または手動で、クラスタ内のロギングエージェントとモニタリングエージェントを再インストールします。

詳しくは、以下のリンクを参照してください。

リモート・ヘルス・レポートの有効化

テレメトリーは、クラスターに関する集約データ (コンポーネントの正常性、使用中のリソースの数とタイプなど) を収集するリモート・ヘルス・モニター機能です。パブリック・クラスターを使用している場合は、独自のテレメトリー・データを使用するためにアカウントに表示することを選択できます。詳しくは、 Telemetry for remote health monitoring を参照してください。