Database
 sql >> Database >  >> RDS >> Database

Scoperta e classificazione dei dati SQL

Con le recenti leggi sulla protezione dei dati e l'implementazione del GDPR lo scorso anno, è fondamentale per noi conoscere il tipo di dati che i nostri database stanno archiviando. Questo ci aiuterà a classificare i dati in base alle normative e ci aiuterà a soddisfare gli standard sulla privacy dei dati. È abbastanza difficile per i DBA conoscere il tipo di dati all'interno di un database. Tuttavia, in SQL Server Management Studio (SSMS) è disponibile un nuovo strumento integrato che può aiutarci a scoprire facilmente i dati all'interno del database. Con questo strumento potremo classificare i dati e lavorare alla segnalazione di eventuali dati sensibili.

Regolamento globale sulla protezione dei dati, noto anche come GDPR

Il GDPR è stato adottato per la prima volta nel 2016 ed è entrato in vigore nel 2018. Fondamentalmente, è un nuovo quadro per la protezione dei dati in Europa. Tuttavia, non riguarda solo le organizzazioni situate all'interno dell'UE, ma qualsiasi cosa ad essa collegata in remoto. È importante che le organizzazioni conoscano le implicazioni del mancato rispetto di queste normative, poiché le conseguenze possono essere dannose. Per avere un'idea delle conseguenze, si rimanda al paragrafo 5 qui:https://gdpr-info.eu/art-83-gdpr/, “Le violazioni delle seguenti disposizioni sono soggette, ai sensi del paragrafo 2, a sanzioni amministrative fino a 20 000 000 EUR o, nel caso di un impegno, fino al 4 % del fatturato annuo totale mondiale dell'anno finanziario precedente, a seconda di quale sia maggiore . Per uno di questi motivi, noterai che un certo numero di aziende si stanno arrampicando per soddisfare i requisiti normativi lo scorso anno. Anche le principali aziende in tutto il mondo, inclusa Microsoft, hanno implementato il GDPR in tutti i loro clienti in tutto il mondo, indipendentemente dal fatto che si trovino all'interno dell'UE o all'esterno. In qualità di DBA o professionisti dei dati, dobbiamo essere consapevoli delle conseguenze delle nostre azioni e comprendere l'importanza dei dati archiviati nei nostri database.

Scarica la versione più recente di SQL Server Management Studio (SSMS)

Prima di iniziare la demo per il rilevamento e la classificazione dei dati, è importante scaricare la versione più recente di SQL Server Management Studio (SSMS). Come sapete, SSMS non fa più parte dell'installazione di SQL Server, ci sono nuove versioni del prodotto che vengono rilasciate frequentemente con funzionalità più recenti e aggiornate. Poiché il rilevamento e la classificazione dei dati è uno strumento integrato in SSMS, si consiglia di disporre sempre della versione più recente di SSMS. Al momento della stesura di questo articolo, l'ultima versione di SSMS è la 17.9.1 e può essere scaricata qui. Assicurati di chiudere tutte le versioni di SSMS sul tuo server prima dell'installazione, poiché l'installazione si interrompe quando SSMS è in esecuzione. Una volta installato, riavvia il server e procedi con i passaggi successivi.

Ripristina un database di esempio

Per dimostrare la nuova funzionalità di classificazione dei dati incorporata in SSMS, è possibile utilizzare il database di SQL Server di esempio disponibile per il download. Ho usato il database di esempio "WideWorldImporters" in questa demo. Puoi scaricare un file di backup di esempio e ripristinarlo sul tuo server. Fare riferimento a questo collegamento per il file di backup. Puoi scaricare il file selezionato come mostrato di seguito.

Una volta scaricato il file di backup, ripristinare il database utilizzandolo. È possibile utilizzare questo script di esempio per eseguire il ripristino. Potrebbe essere necessario aggiornare i percorsi delle cartelle in base alla posizione sul server.

restore database WideWorldImporters
from disk='C:\WideWorldImporters-Full.bak'
with move 'WWI_Primary' to 'C:\SQLData\WideWorldImporters.mdf',
     move 'WWI_UserData' to 'C:\SQLData\WideWorldImporters_UserData.ndf',
	 move 'WWI_Log' to 'C:\SQLData\WideWorldImporters.ldf',
	 move 'WWI_InMemory_Data_1' to 'C:\SQLData\WideWorldImporters_InMemory_Data_1',
	 stats

Classifica i dati

Una volta ripristinato il database, fai clic con il pulsante destro del mouse in SSMS, vai su Attività e fai clic su Classifica dati , come mostrato di seguito.

Dopo aver fatto clic su Classifica dati , si aprirà una finestra di dialogo in cui è possibile visualizzare i consigli di classificazione.

Dopo aver fatto clic su Fai clic per visualizzare , sarà possibile visualizzare l'elenco dettagliato delle colonne consigliate per la classificazione dei dati. Nello screenshot qui sotto, puoi vedere un elenco di 92 colonne con consigli di classificazione. Lo strumento è stato in grado di eseguire la scansione per te e fornire consigli senza alcun input da parte dell'utente.

Seleziona diverse colonne nell'elenco consigliato

Delle 92 colonne consigliate, possiamo prima selezionare diverse colonne nell'elenco e visualizzare le modifiche che si verificano. Nella nostra demo, selezioneremo l'Indirizzo email colonna nella Persone tavolo. Nello screenshot qui sotto, puoi vedere che Indirizzo email colonna è selezionata sul lato sinistro. Una volta fatto, vedrai il Accetta i consigli selezionati opzione. In caso contrario, questa opzione è disattivata.

Nella colonna dell'etichetta di riservatezza, puoi anche vedere se la colonna deve aderire al GDPR o meno. Una volta selezionata la colonna, vedrai che il consiglio deve essere salvato.

Fai clic su Salva e vedrai la conferma che le modifiche sono state aggiornate correttamente.

Ora puoi fare clic su Visualizza rapporto per generare un report per la classificazione dei dati SQL per il database WideWorldImporters. Il rapporto è mostrato di seguito.

Nel report è possibile visualizzare il conteggio totale di tabelle, colonne e distribuzione dei dati. Sotto la distribuzione dei dati, puoi vedere se i dati sono etichettati come GDPR o meno. Utilizzando questo strumento, hai una migliore comprensione dell'importanza e del tipo di dati archiviati nel tuo database. Per semplificare le cose, puoi anche esportare questo rapporto come Excel, PDF o Word e inviarlo via email al tuo business manager o CIO per la revisione. Basta fare clic con il pulsante destro del mouse in un punto qualsiasi del rapporto e utilizzare una delle opzioni come mostrato di seguito.

Seleziona tutte le colonne nell'elenco consigliato

Nell'esempio precedente, hai applicato solo una colonna dall'elenco di colonne consigliate. Tuttavia, hai la possibilità di selezionare tutte le colonne nell'elenco consigliato e rendere il tuo database conforme in termini di politiche di sicurezza dei dati. Seleziona la casella di controllo opzione selezionando così tutte le colonne nell'elenco consigliato, come mostrato nella schermata seguente.

Con questa opzione, tutte le colonne vengono selezionate e sono pronte per essere applicate. Per apportare le modifiche al database, fai clic su Accetta i consigli selezionati . Nello screenshot puoi vedere 91 colonne con consigli di classificazione. Con un semplice clic di un pulsante, puoi applicare i consigli per tutte quelle colonne. Proprio come hai fatto nell'esempio precedente per una singola colonna, vai avanti e fai clic su Salva per completare il processo.

Dopo aver fatto clic su Salva , le modifiche alla classificazione vengono aggiornate correttamente. Ora, fai clic su Visualizza rapporto per visualizzare il rapporto dettagliato sulla classificazione dei dati.

Da questo report puoi vedere che tutte le colonne classificate appartenevano alle tabelle all'interno di 4 schemi. Per ottenere i dettagli dei nomi delle tabelle, fai clic sulla Tabella colonna da visualizzare. Il rapporto ha un grafico a torta con i dettagli della sensibilità al GDPR. C'è anche un altro utile grafico a torta per la distribuzione del tipo di informazioni.

Aggiungi opzione di classificazione

Potresti aver notato che un certo numero di tabelle sono state etichettate come contenenti dati sensibili dal rapporto di classificazione dei dati generato. Ciò è avvenuto attraverso la raccomandazione che è stata generata utilizzando questo strumento di classificazione dei dati. Tuttavia, potresti voler rivedere ulteriormente il rapporto e aggiungere la tua classificazione dei dati in base alla tua comprensione dei dati. Questo è un processo manuale, in cui selezioniamo le colonne da soli. Dal rapporto sulla classificazione dei dati riportato di seguito, puoi vedere che solo una colonna Tasso fiscale nelle Righe d'ordine la tabella è classificata per contenere dati riservati.

Tuttavia, ti rendi conto che anche altre colonne di questa tabella devono essere presenti in questo rapporto. Puoi rivedere le Linee d'ordine tabella e pianifica di includere la Descrizione colonna nel rapporto sulla classificazione dei dati.

In questo caso, fare clic con il pulsante destro del database ed eseguire le stesse operazioni eseguite in precedenza per la classificazione dei dati. Vedrai Aggiungi classificazione opzione.

Una volta terminato, puoi selezionare la tabella e la colonna come mostrato di seguito. Selezionare le opzioni disponibili nel menu a discesa per classificare i dati. Nello screenshot qui sotto, puoi vedere che la Descrizione colonna nelle Righe d'ordine la tabella è contrassegnata come Riservata . Aggiungi la classificazione dei dati facendo clic su Aggiungi pulsante.

Al termine, fai clic su Salva per aggiornare le modifiche.

Per confermare che le modifiche siano state applicate correttamente, puoi rieseguire il rapporto di classificazione dei dati come hai fatto nei passaggi precedenti. Successivamente, puoi verificare che la colonna sia stata aggiunta correttamente.

Nel rapporto puoi confermare che la Descrizione colonna è stata effettivamente aggiunta correttamente ed è etichettata come riservata. Con questo approccio, puoi etichettare altre colonne a tua scelta in base a determinati requisiti o indicazioni della direzione.

Proprietà estese nelle colonne

Quando si controllano ulteriormente le colonne, è possibile ottenere i dettagli della vista del catalogo delle proprietà estese relative alle colonne etichettate per la classificazione dei dati. Ad esempio, quando fai clic con il pulsante destro del mouse su Descrizione nella colonna Sales.OrderLines tabella, potrai visualizzare i dettagli nelle Proprietà estese sezione per quella colonna.

Il nome_tipo_informazioni_sistema e sys_sensitivity_label_name i valori sono descrizioni nella colonna di sys.extended_properties vista catalogo. I metadati relativi a queste classificazioni dei dati sono archiviati in questa vista catalogo:sys.extended_properties .

Commenti aggiuntivi

Con questo nuovo strumento, noterai che il team di prodotto Microsoft ha reso questo compito di classificazione dei dati così semplice e facile da usare. Ad essere onesti, non ci sono vere scuse per la mancanza di comprensione dei dati sottostanti all'interno del tuo database. Considerando l'importanza della protezione dei dati degli utenti e le preoccupazioni di varie agenzie globali in merito alla compromissione dei dati degli utenti da parte di organizzazioni note, è estremamente importante che i DBA e i professionisti dei dati prendano sul serio la protezione dei dati e si tengano al passo con l'ultima offerta tecnologica. Considerando che questo strumento è gratuito e facile da usare, non c'è un vero motivo non per utilizzarlo nei tuoi sistemi di produzione.

Conclusione

  • In questo articolo hai letto dell'utilizzo di una nuova fantastica funzionalità all'interno di SQL Server Management Studio (SSMS)
  • Hai appreso brevemente una serie di elementi importanti sulla protezione dei dati
  • Hai compreso l'importanza di mantenere aggiornata la tua versione SSMS con le ultime versioni in modo da non perdere nessuna nuova funzionalità o aggiornamento
  • Hai visto come testare facilmente nuove funzionalità ripristinando un database SQL Server di esempio
  • Hai imparato a classificare i dati utilizzando SSMS
  • Hai imparato a generare rapporti per visualizzare i dettagli delle colonne etichettate
  • Hai imparato ad aggiungere manualmente le tue classificazioni dei dati in base alla tua comprensione dei dati sottostanti
  • Sai anche che tutte le classificazioni dei dati possono essere eseguite sulla base di questo semplice strumento e puoi generare rapporti sorprendenti e ottenere una migliore comprensione dei dati e del database che stai gestendo.