35.3 Monitoraggio dei servizi

Uno dei fattori essenziali di un ambiente ad alta disponibilità è l'utilizzo di un metodo affidabile e coerente per monitorare le risorse che devono avere una disponibilità elevata e le eventuali risorse da cui esse dipendono. SLE HAE utilizza un componente denominato Resource Agent che esegue questo monitoraggio. La funzione di Resource Agent consiste nel comunicare lo stato di ciascuna risorsa e, quando richiesto, nell'avviare e arrestare la risorsa stessa.

Al fine di evitare tempi di fermo non necessari, i componenti Resource Agent devono comunicare lo stato delle risorse monitorate in modo affidabile. I falsi positivi (cioè i casi in cui una risorsa viene giudicata in condizione di guasto ma in realtà è in grado di ripristinarsi autonomamente) possono causare la migrazione non necessaria di servizi (con relativi tempi di fermo), mentre i falsi negativi (cioè i casi in cui Resource Agent segnala che una risorsa è in funzione anche se non sta operando correttamente) possono impedire l'uso corretto del servizio. D'altro canto, il monitoraggio esterno di un servizio può risultare alquanto difficoltoso: la porta di un servizio Web potrebbe rispondere ad un semplice ping, ad esempio, ma non essere in grado di fornire dati corretti in risposta a una vera e propria interrogazione. In molti casi le funzionalità di autodiagnosi devono essere integrate nel servizio stesso affinché forniscano valori precisi.

Questa soluzione integra in Sentinel un Resource Agent di tipo OCF, in grado di monitorare gli errori principali di hardware, sistema operativo o sistema Sentinel. Al momento le funzionalità esterne di monitoraggio per Sentinel sono basate sui controlli delle porte IP ed esiste la possibilità che si verifichino falsi positivi e falsi negativi. Per migliorare la precisione di questo componente è stata pianificata per il futuro l'ottimizzazione sia di Sentinel che del Resource Agent.