Ormai tutti sanno che i dati sono molto preziosi. Le grandi aziende utilizzano i dati per prendere decisioni che, si spera, portino avanti il business e raggiungano un livello più elevato di redditività. In qualità di amministratori di database, proteggiamo i dati, in particolare le informazioni di identificazione personale (PII). I sistemi vengono violati per ottenere dati. C'è molto valore nei dati e dovresti vivere sotto la proverbiale roccia per impararlo oggi.
Quello di cui leggo raramente, e l'argomento di questo post sul blog, è come il valore dei dati cambia nel tempo. Il valore dei dati dovrebbe essere utilizzato per guidare le tue politiche di conservazione.
La maggior parte dei dati perde il suo valore più invecchia. Di recente stavo lavorando a un progetto riguardante le prestazioni delle applicazioni e le metriche che acquisiamo per misurare tali prestazioni. Alcune persone del progetto volevano mantenere quelle metriche per più di cinque anni. Ho parlato e ho fatto sapere al gruppo che le metriche delle prestazioni di cinque anni non hanno valore. La nostra applicazione cambia troppo nel corso degli anni. Non è possibile confrontare le prestazioni dell'applicazione oggi con le prestazioni dell'applicazione cinque anni fa. Non sarà un confronto mele-mele.
Non tutto il valore dei dati diminuisce alla stessa velocità. Nell'esempio che ho fornito nel paragrafo precedente, i dati metrici per le prestazioni dell'applicazione valgono zero in cinque anni. Tuttavia, un rivenditore che dispone di dati per indicare che un cliente ha acquistato pannolini cinque anni fa, ora sa che è probabile che il cliente acquisterà vestiti per un bambino di cinque o sei anni oggi. Quel bambino è molto probabilmente alle elementari e potrebbe aver bisogno di materiale scolastico. In questo caso, i dati degli acquisti di quel cliente di cinque anni fa hanno ancora un certo valore. I dati non sono privi di valore. Detto questo, non abbiamo bisogno di tutti i punti dati di cinque anni fa. Abbiamo solo bisogno di un riepilogo dell'attività di quel cliente per trarre conclusioni significative sui suoi acquisti attuali e futuri.
Troppo spesso vedo che le persone trattano i sistemi di database come una discarica. I dati vengono semplicemente scaricati lì e pochissime persone pensano molto a cosa fare con quei dati a lungo termine. Pochissime persone pensano molto a quanto valgono quei dati a lungo termine. C'è un costo associato alla memorizzazione di tali dati. Se i dati hanno un valore scarso o nullo a causa della loro età, vale il costo di mantenere quei dati nel database?
Esistono strategie di mitigazione da impiegare per i dati meno recenti. L'amministratore del database può spostare i dati meno recenti e di valore inferiore a un livello di archiviazione più economico. Se i dati hanno valore zero, i dati dovrebbero essere distrutti. Molte volte, non abbiamo più bisogno dei dettagli completi di quei vecchi dati quando i riepiloghi saranno sufficienti, nel qual caso aggreghiamo i dati e memorizziamo i risultati. Quindi sbarazzati dei dettagli.
In qualità di amministratore del database, è tua responsabilità essere l'amministratore dei tuoi dati e delle risorse necessarie per ospitarli. Dovresti sempre chiedere i passaggi appropriati necessari per prenderti cura di quei dati man mano che invecchiano.