Sqlserver
 sql >> Database >  >> RDS >> Sqlserver

4 modi per prevenire il sovraccarico degli avvisi con il monitoraggio di SQL Server

Per gli amministratori di database incaricati di rispondere agli avvisi di SQL Server a tutte le ore del giorno e della notte, la sensazione di sovraccarico è probabilmente esacerbata dalla raffica costante di notifiche che qualcosa richiede la tua attenzione. GIUSTO. ORA.

Il monitoraggio di SQL Server è fondamentale per mantenere la disponibilità elevata e tenere traccia dei problemi di prestazioni nel sistema e gli avvisi sono senza dubbio il modo più efficiente per scoprire che c'è un problema. Ma è possibile avere troppo di una cosa buona.

Come si suol dire, "Quando tutto è una priorità, niente è una priorità". L'esaurimento degli avvisi è reale e può portarti a ignorare o ignorare eventi che influiscono negativamente sui tuoi utenti.

Quando configuri il monitoraggio delle prestazioni di SQL Server, è importante configurare gli allarmi in modo consapevole e in modo da controllare quando, perché e con quale frequenza ricevi le notifiche. Ecco quattro modi per gestire gli avvisi che ti aiuteranno ad alleviare il sovraccarico di avvisi e a salvare ciò che resta della tua sanità mentale.

1. Disattiva gli allarmi che non ti servono

Per molti DBA, questo è più facile a dirsi che a farsi. C'è un piccolo elemento di terrore al pensiero di scegliere quali avvisi non ricevere. Fortunatamente, ci sono alcune best practice che puoi implementare che possono rendere la tua FOMO un po' meno dolorosa.

Una delle cose più semplici che puoi fare è rivedere i registri degli avvisi e disattivare gli avvisi che sono cronicamente falsi allarmi o falsi positivi. Le probabilità sono buone che non ti perderai un vero problema e il tuo cervello apprezzerà la pausa dalla reazione a notifiche non necessarie.

Un'altra strategia viene dagli ingegneri dell'affidabilità del sito (SRE) di Google. Gli SRE sono responsabili della disponibilità, latenza, prestazioni, efficienza, gestione delle modifiche, monitoraggio, risposta alle emergenze e pianificazione della capacità.

I team SRE dispongono di un sistema di avviso/biglietto/registro per ridurre al minimo il sovraccarico di avvisi assegnando una risposta a un evento basata sulla rapidità con cui è richiesto l'intervento umano. Le tre possibili risposte includono:

  • Avviso:un avviso viene inviato solo se una persona deve agire immediatamente.
  • Biglietto:se l'evento richiede l'intervento di una persona, ma può attendere fino al normale orario lavorativo, viene inviato un biglietto che passa attraverso i normali canali.
  • Registro:se non è richiesta alcuna azione, l'evento viene registrato per la diagnostica.

2. Usa gli allarmi intelligenti per arrivare rapidamente alla causa principale di un avviso

Quando il tuo telefono esplode con le notifiche alle 3 del mattino, non vuoi passare un'ora a curiosare per risolvere il problema.

Gli allarmi intelligenti non solo ti dicono che hai un problema, ma suggeriscono anche modi per risolverlo e aiutarti a identificare la causa principale. Gli allarmi intelligenti forniscono anche dati storici sull'evento in modo da sapere cosa è successo immediatamente prima e dopo l'attivazione dell'avviso.

3. Dai la priorità ai tuoi avvisi per identificare i problemi più urgenti

Tutti gli avvisi non vengono creati allo stesso modo, quindi è importante configurare lo strumento di monitoraggio delle prestazioni di SQL Server in modo che invii solo avvisi per i problemi più importanti. Assegnando la priorità agli avvisi in base al livello di gravità, all'impatto sull'azienda o ai clienti e se è necessaria un'azione immediata, elimini parte del rumore generato dagli avvisi che non sono critici.

Concentrati sull'impostazione di avvisi per problemi che possono causare la disconnessione dei tuoi server, la grave corruzione dei dati o una significativa perdita di dati (ad esempio, gravità 17 o superiore e messaggi di errore 823, 824 e 825).

4. Gestisci gli allarmi applicando soglie e regole specifiche

L'impostazione di soglie e regole è un enorme risparmio di sanità mentale perché ti aiuterà a evitare di essere bombardato da più avvisi in un breve lasso di tempo.

Quando si definiscono le soglie delle prestazioni, SQL Server evita di inviare notifiche fino a quando un valore per una metrica specifica non raggiunge un livello preoccupante, ad esempio, lo spazio libero su disco oi livelli di memoria fisica libera sono pericolosamente bassi. Ciò consente ai DBA di lavorare su altre attività senza monitorare costantemente le metriche.

L'impostazione delle regole per gli avvisi ti consente di personalizzare le azioni, ad esempio la frequenza con cui desideri ricevere le notifiche. Ad esempio, è possibile impostare SQL Server in modo che invii una notifica solo quando un avviso specificato è stato attivato quattro volte o se l'avviso contiene un determinato oggetto di database o nome utente.

Man mano che i DBA iniziano a navigare in un ambiente aziendale nuovo e molto diverso dopo il COVID-19, i livelli di stress aumenteranno sicuramente. Mantenere un'elevata disponibilità e garantire che i sistemi SQL Server siano sicuri e che funzionino in modo ottimale rimarranno una grande priorità. Ma ora è un buon momento per integrare le funzionalità di monitoraggio di SQL Server per assumere il controllo delle configurazioni degli avvisi ed eliminare il rumore non necessario.