Database
 sql >> Database >  >> RDS >> Database

RowGen v3 automatizza la generazione dei dati di test del database

Il valore di buoni dati di test per i DBA è ben noto:

“Il test delle applicazioni ad alta intensità di database presenta sfide uniche che derivano da dipendenze nascoste, sottili differenze nella semantica dei dati, schemi di database di destinazione e regole aziendali implicite. Queste sfide diventano ancora più difficili quando l'applicazione coinvolge database integrati ed eterogenei o dati riservati. Dati di test adeguati che simulano problemi di dati del mondo reale sono fondamentali per ottenere benchmark di qualità ragionevoli per la convalida dell'input funzionale, il carico, le prestazioni e le prove di stress. ” – Ali Raza e Stephen Clyde, estratto da Creazione di set di dati per il test di database relazionali

Il test delle operazioni del database, la prototipazione del data warehouse e dei lavori ETL/ELT, l'outsourcing sicuro di campioni e report di file e l'esecuzione di benchmark delle prestazioni su dispositivi DB richiedono tutti dati di test con l'aspetto del database di produzione in modo che le applicazioni che utilizzano tali dati di test ora lo faranno eseguire correttamente con dati reali in seguito. Nel loro libro del 2012, Raza e Clyde confrontano la generazione dei dati dei test con l'estrazione dei dati dei test.

L'IRI ei suoi utenti sanno che l'utilizzo di dati reali per i test è indesiderabile. La ragione più ovvia oggi è che i dati reali rischiano di esporre informazioni di identificazione personale (PII) che devono essere mantenute riservate. Uno sviluppatore o un tester non vuole eseguire processi o testare un sistema di database e rischiare di condividere le informazioni sui clienti come numeri di previdenza sociale, informazioni sulla carta di credito, date di nascita, ecc. durante questa fase. I dati reali attualmente disponibili potrebbero inoltre non essere sufficientemente solidi o realistici per sottoporre a stress test applicazioni o database che dovranno gestire volumi e/o intervalli di valori maggiori.

Sfortunatamente, Raza e Clyde hanno scritto il loro libro prima del rilascio di RowGen v3, quando potrebbero aver osservato che genera dati di test che:

1) non espone PII perché contiene valori di colonna nuovi o randomizzati
2) mantiene l'integrità strutturale e referenziale definita nel DDL originale
3) non è limitato ai volumi di dati del database originale o intervalli di valori
4) possono essere personalizzati tramite la generazione di script per soddisfare requisiti complessi
5) è preordinato e caricato automaticamente in blocco per il popolamento più rapido possibile
6) sono definiti in batch script che hanno una flessibilità diversa e possono essere esportati, riutilizzati e modificati secondo necessità

IRI RowGen v3 è l'ultima versione del generatore di dati di test ad alto volume più veloce e robusto al mondo per database relazionali. RowGen verrà eseguito dalla GUI di IRI Workbench basata su Eclipse, dalla riga di comando o da programmi batch, per produrre la qualità e la quantità di dati di test necessari per riflettere accuratamente l'ambito, i layout e le relazioni all'interno dei database di produzione e, a sua volta, data warehouse e datastore operativi.

La nuova procedura guidata DB Test Data di RowGen v3, una volta avviata dalla GUI di IRI Workbench, guida gli utenti attraverso la specifica e l'automazione di:

Analisi – selezionando lo schema e le tabelle da popolare, RowGen traduce le descrizioni delle tabelle del database e i vincoli di integrità in script .rcl che specificano la struttura di origine, gli insiemi dipendenti e la creazione dei dati, nell'ordine necessario per popolare le tabelle nel formato corretto, e rispettando tutte le chiavi primarie, gli indici univoci e le relazioni di chiavi esterne.

Generazione – creando ed eseguendo gli script .rcl per creare un file di test per tabella che può essere caricato in blocco e/o salvato per un uso futuro.

Popolazione – caricando in blocco le tabelle di destinazione nell'ordine corretto con dati di test preordinati che siano strutturalmente e referenzialmente corretti.

Il processo può caricare rapidamente enormi database di test e rispettare sia le regole aziendali che le leggi sulla privacy dei dati. I dati generati sono realistici e sufficientemente robusti da sottoporre a stress test le operazioni di database e le applicazioni di query.

RowGen v3 supporta anche opzioni basate su regole e script per controllare valori di campo specifici e distribuzioni di intervalli di valori che soddisfano vincoli di database specifici e rappresentano al meglio l'aspetto e i tassi di occorrenza dei dati in produzione. Gli utenti possono anche rappresentare graficamente e dimostrare visivamente che i valori del test sono conformi a distribuzioni lineari, normalizzate, ponderate o standard.

Per ulteriori informazioni su RowGen v3, vedere www.iri.com/products/rowgen, www.iri.com/products/rowgen/gui  o leggere gli altri articoli nella sezione Test Data del blog IRI.