Avvisi di inattività
Puoi definire gli avvisi di inattività di IBM Cloud Monitoring nell'editor degli avvisi utilizzando un modulo.
IBM Cloud Monitoring monitora continuamente diversi tipi di entità nella tua infrastruttura, come un host, un contenitore, un processo e invia notifiche quando l'entità monitorata non è disponibile o non risponde. Gli avvisi di inattività si concentrano principalmente sui tempi di inattività non pianificati di programmi, contenitori e host nella tua infrastruttura.
Per monitorare il tempo di inattività delle entità, sono utilizzate le seguenti metriche: sysdig_host_up
, sysdig_container_up
e sysdig_program_up
. Indicano se l'agente è in grado di comunicare con il programma
di raccolta. Il valore 1 rappresenta che l'entità è attivo e che l'agent sta inviando queste informazioni al raccoglitore. Il valore 0 rappresenta che l'entità non è attiva, implica che non viene eseguita alcuna comunicazione tra l'agent e il
raccoglitore sull'entità.
Quando un avviso viene configurato in base alla metrica ab up
, vengono eseguite due query API di dati durante il controllo dell'avviso. Una query richiamerà i valori correnti e l'altra richiamerà i valori dall'intervallo di controllo
avviso precedente. Per ogni entità presente nell'intervallo precedente e non presente nell'intervallo corrente, la metrica è contrassegnata come 0.
Un valore aggregato della metrica up
viene visualizzato sul pannello di controllo nell'Editor avvisi con un valore compreso tra 0 e 1.
Definizione di un avviso di fermo apparecchiatura
Considerare quanto segue quando si configura un avviso di tempo di inattività:
- Impostare un nome e una descrizione significativi che consentano ai destinatari di identificare facilmente l'avviso.
- Imposta un livello di severità per il tuo avviso. La Severità avviso (
High
,Medium
,Low
eInfo
) si riflette nell'elenco Avvisi. È possibile ordinare gli avvisi in base alla severità. È possibile utilizzare la severità come criterio durante la creazione di avvisi. Ad esempio, si desidera essere avvisati se ci sono più di 10 eventi di severità elevata. - Specificare più segmenti. La selezione di un singolo segmento potrebbe non fornire sempre informazioni sufficienti per risolvere il problema. Arricchire l'entità selezionata con le relative informazioni aggiungendo ulteriori segmenti correlati. Immettere le entità gerarchiche in modo da comprendere cosa non ha funzionato e dove. Ad esempio, specificare un cluster Kubernetes da solo non fornisce il contesto necessario per la risoluzione dei problemi. Per restringere il problema, aggiungere ulteriori informazioni contestuali, come lo spazio dei nomi Kubernetes, la distribuzione Kubernetes e così via.
Condizioni di fermo apparecchiatura
È possibile configurare l'avviso di fermo apparecchiatura in base ad una serie di condizioni.
Ambito
È possibile filtrare l'ambiente in cui verrà applicato l'avviso. Ad esempio, un avviso verrà inviato quando un contenitore associato all'agente 197288 viene disattivato. L'avviso verrà attivato per ciascun nome contenitore e ID agent.
L'utilizzo può utilizzare gli operatori in
o contain
per mettere in corrispondenza più valori possibili differenti.
Gli operatori contain
e not contain
consentono di richiamare i valori se si conosce parte dei valori. Ad esempio, us
richiama i valori che contengono stringhe che iniziano con "us", come ad
esempio “us-east-1b”, “us-west-2b”e così via.
Gli operatori in
e not in
consentono di filtrare più valori.
È anche possibile creare avvisi direttamente da Esplora e Dashboard per popolare automaticamente l'ambito.
Metrica
Selezionare una metrica di tempo di attività associata all'entità di cui si desidera monitorare il tempo di inattività. È possibile selezionare una delle seguenti entità: host
, container
o program
.
Entità
Specificare ulteriori segmenti utilizzando l'opzione Avviso se presente.
Le entità specificate vengono segmentate e notificate con il modello di notifica predefinito e nell'anteprima.
Trigger
Definire la soglia e la finestra temporale per valutare la condizione di avviso. Le scale temporali supportate sono minute
, hour
o day
. Ad esempio, se il programma monitorato non è disponibile o non risponde
per l'ultimo minuto, i destinatari degli avvisi riceveranno una notifica.
È possibile impostare qualsiasi valore per la percentuale (%) e un valore maggiore di 1 per la finestra tempo. Ad esempio, se si sceglie 50% invece del 100%, verrà attivata una notifica quando l'entità è inattiva per 5 minuti nella finestra temporale selezionata di 10 minuti.
Casi d'uso di esempio
Alcuni casi di utilizzo in cui si potrebbe considerare l'utilizzo di un avviso di fermo apparecchiatura sono:
- Quando il tuo sito e-commerce è giù durante le ore di punta del Black Friday, Natale o Capodanno.
- Quando i server di produzione del tuo data center riscontrano un'interruzione critica.
- Quando un database MySQL non è raggiungibile.
- Quando un caricamento di file non funziona sul tuo sito web di marketing.