Il tempo e la tecnologia continuano ad accelerare e i dati che salviamo continuano a crescere in modo esponenziale. Pertanto, la definizione esatta di un database molto grande (VLDB) continua a cambiare con i nuovi progressi nell'hardware e nel software. Ma montare un VLDB sul tuo nuovo tablet, o anche su un laptop, in genere non accadrà, almeno non ancora.
Quanto è grande un database molto grande?
Molte autorità tecnologiche discutono sull'effettivo punto di partenza di ciò che costituisce un VLDB. Alcuni dicono database di 100 gigabyte o più. Altri sostengono che un VLDB abbia una dimensione di almeno 1 terabyte (1000 GB). Può anche essere misurato dal numero e dal tipo di query e transazioni complesse che può supportare. Ma indipendentemente dalla quantità esatta, è sicuro affermare che un VLDB contiene un'enorme quantità di informazioni, disseminate in un numero estremamente elevato di tuple (righe di database) e occupa un enorme spazio di archiviazione in un file system fisico.
Sai che hai a che fare con un VLDB quando le sue stesse dimensioni richiedono più lavoro. Non essere in grado di eseguire il backup del database in un periodo di tempo ragionevole e i vincoli finanziari nella duplicazione del DB a scopo di test sono solo un paio dei problemi che devono essere affrontati.
Chi usa i VLDB?
Molte aziende e organizzazioni utilizzano VLDB, inclusi comuni, appaltatori della difesa del governo, società di ricerca e grandi imprese del settore finanziario. Un ottimo esempio di chi sfrutta regolarmente i VLDB a proprio vantaggio strategico è TAC, un gruppo di ricerca europeo completamente indipendente che fornisce servizi di consulenza su questioni economiche e finanziarie internazionali per investitori finanziari, aziende industriali e organizzazioni multilaterali. TAC costruisce VLDB, principalmente per uso interno, ma alcuni sono stati messi a disposizione del pubblico per scopi analitici di monitoraggio degli investimenti esteri e degli obiettivi di sviluppo.
Altre aziende utilizzano i VLDB per il confronto dei dati, il data mining, il data warehousing, le repliche, le query, le dimostrazioni e una moltitudine di funzioni aggiuntive. Gli osservatori delle tendenze tecnologiche monitorano con loro. I responsabili IT progettano e sviluppano con loro. Gli esperti di ricerca e sviluppo e le unità di innovazione tengono traccia delle statistiche con loro. E i VLDB svolgono un ruolo sempre più importante nella richiesta di informazioni personalizzate sul World Wide Web.
Quindi come gestisci un database molto grande?
La storia di David vs. Goliath viene spesso in mente quando le persone scoprono che i loro database si avvicinano al terabyte. Diventa sempre più difficile allocare spazio e velocizzare le query. Quindi quel compito apparentemente insormontabile di recuperare spazio e migliorare le prestazioni deve poi essere affidato a un esperto, dotato del know-how e degli strumenti tecnologici per conquistare quel gigante.
I VLDB possono essere controllati efficacemente dal giusto tipo di Database Management System (DBMS); vale a dire, software per computer (o suite di software) appositamente progettato che fornisce un'interfaccia tra il database e l'utente finale, consentendo la creazione, l'interrogazione, l'aggiornamento e l'amministrazione dei dati. Un DBMS mantiene anche la sicurezza e l'integrità dei dati archiviati e facilita il recupero delle informazioni in caso di guasto di un sistema. E ci sono diversi tipi di DBMS, ma salveremo quella dissertazione per un altro blog in un altro momento.
Lo sviluppo della maggior parte dei sistemi di gestione dei database è estremamente complesso e dispendioso in termini di tempo, poiché richiede aggiornamenti continui con avanzamenti nella memoria, nell'archiviazione, nei processori e nelle reti del computer. I database continuano ad aumentare in termini di dimensioni, ambito e prestazioni, poiché gli sviluppatori di software si sforzano di tenere il passo con le richieste dei moderni aumenti del volume di dati. Come la maggior parte della vita nel 21° secolo, abbiamo fatto molta strada molto velocemente e abbiamo i dati per dimostrarlo!