アラートおよびイベントの処理
IBM Cloud Monitoring サービスでは、注意が必要な問題について通知するために単一条件アラートおよび複数条件アラートを構成できます。 アラートがトリガーされると、1 つ以上の通知チャネルで通知を受け取ることができます。 アラートの定義によってマルチチャネル通知を生成できます。
アラートとは、注意する必要がある状態について警告するために使用可能な通知イベントです。 各アラートには、重大度を表す状況が存在します。 この状況により、報告された情報の重要度が通知されます。
アラートを定義する場合は、通知をトリガーする条件と、通知に使用する 1 つ以上の通知チャネルを定義する必要があります。 また、アラートの重大度とアラートのタイプも定義する必要があります。 アラートの構成方法について詳しくは、アラートの構成を参照してください。
デフォルトでは、重大度は*「警告」に設定されています。 アラートの重大度は、「緊急 (emergency)」、「アラート (alert)」、「重大」、「エラー」、「警告」、「注意」、「通知 (informational)」、「デバッグ (debug*)」に設定できます。
モニター対象のイベントまたは問題の通知を受け取るために、1 つのメトリックまたは一式のメトリックについてのアラートを定義できます。
- 単一条件アラートを定義できます。
- 複数条件アラートを定義できます。 アラートしきい値は、複合条件を使用して構成されます。
- データの集計方法を定義できます。
- ブール論理を使用して、複数のメトリックについて報告するアラートを定義できます。
- アラート条件が満たされると通知を受け取ります。
- アラートごとに複数の通知チャネルを構成できます。
- 時間または日単位でトリガー待機時間を構成するオプションの使用時には、受け取ってから 1 分以内にアラートが実行されます。
- PromQL アラートの場合のみ、オプションで待機時間 0 分を構成できます。
Web UI で、および IBM Cloud Monitoring API を使用して、事前定義されたアラートの有効化、アラートの変更、およびカスタム・アラートの作成を行うことができます。
アラートは、Web UI の*「アラート (Alerts)」*ビューで管理します。 *「アラート (Alerts)」*ビューに表示されるテーブル列を構成できます。 有効なカラム・オプションは、Name、Scope、Alert When、Segment By、Notifications、Enabled、Modified、Captures、Channels、Created、Description、Email recipients、For at least、OpsGenie、PagerDuty、Severity、Slack、WebHook、Type、VictorOpsです。
アラートのタイプ
IBM Cloud Monitoring サービスに用意されている事前定義アラートを有効にすることができます。 また、ダッシュボードのパネル、REST API、または Web UI の*「アラート (Alerts)」* セクションからカスタム・アラートを構成することもできます。
IBM Cloud Monitoring サービスでは、以下に示すタイプのアラートを定義できます。
-
ダウンタイム (Downtime): このタイプのアラートは、ソース (ベア・メタルなど) をモニターし、ソースがダウンした場合にアラートを生成するために使用します。
-
メトリック (Metric): このタイプのアラートは、時系列のメトリックをモニターし、定義したしきい値にメトリックが達した場合にアラートするために使用します。
-
PromQL: このタイプのメトリックは、PromQL 照会を使用してメトリックをモニターするために使用します。
-
イベント (Event): このタイプのアラートは、特定のイベントの発生をモニターし、定義したしきい値にイベントが達した場合にアラートするために使用します。 例えば、このアラートを使用して、多数の無許可アクセス要求が報告される状況をモニターできます。
-
異常検出 (Anomaly Detection): このタイプのアラートは、過去の動作を基準にしてホストをモニターし、予期されるパターンからホストが逸脱した場合にアラートを生成するために使用します。
このタイプの警告は非推奨である。 このタイプの既存のアラートのみを管理できます。
-
グループ外れ値 (Group Outlier): このタイプのアラートは、複数のホストをモニターし、1 台のホストが他のホストと異なる動作をした場合にアラートするために使用します。
このタイプの警告は非推奨である。 このタイプの既存のアラートのみを管理できます。
通知チャネル
通知チャネルは、アラートがトリガーされたときに情報を受け取る場所を定義します。
アラートを構成するときに、1 つ以上の通知チャネルを指定できます。
デフォルトでは、アラートがトリガーされると、「イベント (Events)」 セクションに通知が表示されます。
以下の通知チャネルを構成できます。
- E メール
- IBM Event Notifications
- Microsoft Teams
- OpsGenie
- PagerDuty
- Slack
- Teams Email
- VictorOps
- WebHook
イベント
イベントとは、Monitoring インスタンスにデータを転送するノードで発生した何らかの状況について知らせる通知です。 イベントを使用して、問題を確認、トラッキング、および解決します。
さまざまなタイプのイベントの概要を以下に示します。
- アラート・イベント は、ユーザーが構成したアラートによってトリガーされるイベントです。
- インフラストラクチャー・ベース・イベント は、Docker ノードおよび Kubernetes ノードから収集されるイベントです。 デフォルトでは、モニタリング・エージェントは選択したイベントのグループから自動的にデータを検出し、収集します。 エージェント構成ファイルを編集して、さらにイベントを有効にすることができます。
- 統合 (Slackbot、事前に構築された Python スクリプト、カスタム・ユーザーによって作成された Python スクリプト、または cURL 要求) のいずれかを介して構成するカスタム・イベント。
デフォルトでは、イベントの状態は以下のようになります。
- アクティブ: この状態は、イベントをトリガーした環境がそのまま維持される (例えば、ノードが引き続きダウンしたままになる) ことを示します。
- OK: この状態は、通常状態に戻る (例えば、ノードが稼働中である) ことを示します。
イベントは、Web UI の*「イベント」*セクションで管理します。
- アラート・イベントは、*「アラート・イベント (Alert Events)」*タブで表示できます。
- インフラストラクチャー・ベース・イベントは、*「カスタム・イベント (Custom events)」*タブで表示できます。
- カスタム・イベントは、*「カスタム・イベント (Custom events)」*タブで表示できます。
- カスタム・イベントをいずれかのチームに送信するには、該当するチーム用の API トークンを使用します。 詳しくは、 カスタム・イベントを参照してください。
- イベントを**「解決済み」に設定すると、状況が「OK」**に設定されるまで待たずに、問題が解決されたことを他のユーザーに通知できます。