クラスターの正常性のモニタリング
クラスター・メトリックとアプリのモニタリングを目的として、Red Hat® OpenShift® on IBM Cloud® クラスターには単一のクラスター・インスタンスの正常性を管理するのに役立つ組み込みツールが備わっています。 また、 IBM Cloud Kubernetes Service クラスタアドオン: IBM Cloud Logs および IBM Cloud Monitoring のように、マルチクラスタ分析やその他のユースケースのために IBM Cloud ツールをセットアップすることもできます。
モニタリングのオプションについて
以下の情報を参考にして、組み込みの Red Hat OpenShift ツールと IBM Cloud 統合を状況に応じて使い分けてください。
RHCOS ワーカー・ノードを使用するプライベート専用クラスターでのモニター制限: モニター・エージェントはオペレーティング・システムのカーネル・ヘッダーに依存していますが、RHCOS にはカーネル・ヘッダーがありません。 このシナリオでは、エージェントは sysdig.com
に戻り、プリコンパイルされたエージェントを使用します。 パブリック・ネットワーク・アクセスがないクラスターでは、このプロセスは失敗します。 RHCOS
クラスターでのモニターを可能にするには、 アウトバウンド・トラフィックを許可する か、 エアギャップ環境へのエージェントのインストールに関する Sysdig 資料を参照する必要があります。
IBM Cloud Monitoring
IBM Cloud Monitoring に関する以下の詳細情報を確認してください。
- クラスター・メトリック、コンテナー・セキュリティー、リソース使用量、アラート、およびカスタム・イベントを統合して表示できるカスタマイズ可能なユーザー・インターフェース。
- スクリプトを使用したクラスターとの迅速な統合。
- クラスターとクラウド・プロバイダーをまたいだメトリックの集約およびコンテナーのモニタリング。
- タイムラインとプランに応じた履歴メトリックの利用、およびトレース・ファイルのキャプチャーとダウンロードの機能。
- 高可用性、拡張容易性、および業界のセキュリティー標準に対する準拠。
- IBM Cloud の IAM との統合によるユーザー・アクセス管理。
組み込みの Red Hat OpenShift モニタリング・ツール
OpenShift には、クラスターごとにコア・プラットフォーム・コンポーネントのモニターを提供する、事前構成、プリインストール、および自己更新のモニター・スタックが含まれています。 このモニタリングには、クラスター・メトリック用の openshift-monitoring
プロジェクトの Prometheus および Grafana デプロイメントが組み込まれています。これらは単一ゾーンでのみ使用可能です。 Red Hat OpenShift Web
コンソールから、モニター・ダッシュボード、メトリック、およびアラートを表示および管理できます。 詳しくは、 Red Hat OpenShift 資料の Monitoring を参照してください。
デフォルトでは、モニタリングスタックはメトリック履歴のバックアップに永続ストレージを使用せず、代わりにホストファイルシステム内の一時的な EmptyDir
ボリュームを使用します。 メトリック履歴の保存期間は、クラスターのバージョンに応じて 11 日から 15 日の範囲になります。 一部のワークロードでは、これらの設定によって大量のディスク・スペースとメモリーが使用されたり、メトリック保存の要件が満たされなかったりする可能性があります。 永続ストレージを使用するようにモニター・スタックを構成したり、メトリック保存ポリシーを変更したり、専用ノードで
Prometheus を実行したりすることができます。 詳細については、 監視スタックの設定を参照してください。
Red Hat OpenShift on IBM Cloud version 4.16 では、デフォルトで10 GBのサイズ保持が設定されていることに注意してください。
Red Hat® OpenShift® on IBM Cloud® ストレージ・メトリックのモニター
Red Hat® OpenShift® on IBM Cloud® クラスターには、クラスター管理者がストレージ・ボリュームの可用性と容量に関する情報を取得するのに役立つツールが組み込まれています。
Red Hat OpenShift モニター・ダッシュボードでストレージ・メトリックを表示できない場合は、 Block Storage for VPC メトリックのデバッグを参照してください。
Red Hat® OpenShift® on IBM Cloud® クラスターについて、以下のメトリックをモニターできます。
kubelet_volume_stats_available_bytes
kubelet_volume_stats_capacity_bytes
kubelet_volume_stats_inodes
kubelet_volume_stats_inodes_free
kubelet_volume_stats_inodes_used
E メールや Slack などのプラットフォームのストレージ・モニター・アラートをセットアップする必要がありますか? Red Hat OpenShift 資料の「 外部システムへの通知の送信 」を参照してください。
Block Storage for VPC のメトリックを監視するには、 Block Storage for VPC クラスタ アドオンを有効にしたクラスタが必要で、ワーカー ノードに Block Storage for VPC ボリュームがアタッチされている必要があります。 Red Hat® OpenShift® on IBM Cloud® ストレージ・メトリクスは、マウントされたストレージ・ボリュームに対してのみ入力されます。
-
Red Hat OpenShift Web コンソールにナビゲートし、**「モニタリング」を選択してから「メトリック」**を選択します。
-
ダイアログボックスに監視したいメトリックを入力し、 Run queriesを選択します。
kubelet_volume_stats_used_bytes{persistentvolumeclaim="NAME OF PVC"} / kubelet_volume_stats_capacity_bytes{persistentvolumeclaim="NAME OF PVC"}
出力例
endpoint instance job metrics_path namespace node persistentvolumeclaim prometheus service value https-metrics 11.111.1.1:XX kubelet /metrics default 11.111.1.1 PVC-NAME openshift-monitoring/k8s kubelet 0.003596851526321722
詳しくは、 モニターを参照してください。
ボリュームが容量に達している場合は、ボリューム拡張のセットアップを試してください。
ログ収集および監視エージェントをCloud Logsに移行する
observability CLI プラグイン ibmcloud ob
と v2/observe
エンドポイントはサポートされなくなりました。 直接的な代替品はありませんが、コンソールまたは Helm のチャートから、ロギングとモニタリングの統合を管理できるようになりました。 最新のステップについては 、「 Red Hat OpenShift on IBM Cloud クラスターのログ収集エージェントの管理 」および 「 Red Hat OpenShift モニタリングエージェントの使用」を参照 してください。
ob
プラグイン、Terraform、またはAPIを使用して、クラスタに監視エージェントをインストールしたり、既存の構成を変更したりすることはできなくなりました。 Sysdig エージェントは引き続き、指定された IBM Cloud Monitoring インスタンスにメトリクスを送信します。 LogDNA IBM Cloud Log Analysis が に置き換えられたため、エージェントはログを送信できなくなりました。 IBM Cloud
観測エージェントの確認
observability プラグインは、Sysdig と LogDNA エージェントを ibm-observe
ネームスペースにインストールする。
ibm-observe
名前空間のコンフィグマップを確認します。kubectl get cm -n ibm-observe
Example output NAME DATA AGE e405f1fc-feba-4350-9337-e7e249af871c 6 25m f59851a6-ede6-4719-afa0-eee7ce65eeb5 6 20m
- ObservabilityプラグインによってインストールされたObservabilityエージェントは、ログまたはメトリクスが送信される IBM Cloud Monitoring インスタンスまたは IBM Cloud Log Analysis インスタンスのGUIDを持つconfigmapを使用します。 クラスタに
ibm-observe
以外のネームスペースにエージェントがある場合、またはibm-observe
の configmaps にインスタンス GUID の名前が付けられていない場合、これらのエージェントは IKS observability (ob) プラグインと共にインストールされていません。
観測用プラグインエージェントの削除
- デーモンセットとコンフィグマップをクリーンアップする。
kubectl delete daemonset logdna-agent -n ibm-observe kubectl delete daemonset sysdig-agent -n ibm-observe kubectl delete configmap <logdna-configmap> -n ibm-observe kubectl delete configmap <sysdig-configmap> -n ibm-observe
- オプション:名前空間を削除します。 その名前空間で実行中のリソースが他にない場合。
kubectl delete namespace ibm-observe
プラグインが削除された後、クラスタダッシュボード、Terraform、または手動で、クラスタ内のロギングエージェントとモニタリングエージェントを再インストールします。
詳しくは、以下のリンクを参照してください。
リモート・ヘルス・レポートの有効化
テレメトリーは、クラスターに関する集約データ (コンポーネントの正常性、使用中のリソースの数とタイプなど) を収集するリモート・ヘルス・モニター機能です。 パブリック・クラスターを使用している場合は、独自のテレメトリー・データを使用するためにアカウントに表示することを選択できます。 詳しくは、 Telemetry for remote health monitoring を参照してください。