Sqlserver
 sql >> Database >  >> RDS >> Sqlserver

Cosa significa l'apprendimento automatico per i professionisti del database

I database di machine learning stanno diventando maggiorenni. Ciò presenta enormi opportunità per i professionisti del database che sono in grado di evolversi per trarre vantaggio da questo cambiamento.

Attualmente i professionisti di database, ad esempio gli amministratori di database (DBA) e gli sviluppatori di database, sono alcune delle posizioni più importanti in qualsiasi organizzazione IT. Un professionista del database è responsabile della creazione, della gestione e della fornitura dell'accesso controllato a un database. Avere la persona giusta come DBA può aiutare le aziende a risparmiare tempo e ridurre i tempi di sviluppo delle applicazioni. Tuttavia, con il crescente accesso a un'enorme quantità di dati, le responsabilità di un professionista di database si stanno evolvendo rapidamente.

Sono state sviluppate diverse tecnologie che possono essere utilizzate non solo per gestire ed esplorare i dati, ma possono aiutare a prendere decisioni ben informate sulla base dei dati. L'apprendimento automatico è una di queste tecnologie che ha visto un grande aumento nell'ultimo decennio Questo articolo fornisce una breve panoramica di come l'apprendimento automatico può influire sulle professioni dei database e quali sono i vantaggi di avere l'apprendimento automatico come set di competenze.

Cos'è l'apprendimento automatico?

L'apprendimento automatico è un processo di comprensione ed estrazione di modelli utili dai dati con l'aiuto di vari algoritmi statistici. L'apprendimento automatico è ulteriormente suddiviso in tecniche di apprendimento supervisionato e non supervisionato. L'apprendimento automatico viene attualmente utilizzato per risolvere molti problemi complessi come la classificazione di e-mail di prosciutto e spam, la previsione dei prezzi delle case, la generazione di poesie, la classificazione delle immagini e così via.

Il machine learning sostituirà le professioni di database?

Una delle idee sbagliate più comuni sull'apprendimento automatico è che sostituirà gli esseri umani in molti lavori. Anche se questo potrebbe essere vero per alcune attività ripetitive, l'intelligenza artificiale e l'apprendimento automatico completeranno sostanzialmente il cervello umano e non lo sostituiranno. Per i professionisti dei database, i database di machine learning non li sostituiranno, anzi li aiuteranno enormemente.

Consentirà ai professionisti del database di concentrarsi maggiormente sulla pianificazione e sulle attività strategiche, poiché automatizza le attività più noiose e autonome come l'installazione, la configurazione e gli aggiornamenti regolari del database. Pertanto, invece di temere l'impatto dell'apprendimento automatico sul proprio lavoro, i professionisti del database dovrebbero abbracciarlo come un modo per completare le attività meno impegnative in modo molto più rapido ed efficiente. .

Gestire i big data è una sfida

A causa dell'ascesa del web mondiale negli ultimi due decenni, i dati sono disponibili in tutte le forme e dimensioni. In effetti, il termine big data viene spesso utilizzato per il set di dati che ha un volume enorme, arriva a una velocità elevata e contiene una varietà di contenuti.

La gestione di enormi quantità di tali dati non strutturati è diventata una sfida per DBA. È stato riscontrato che gli algoritmi eseguiti su database di apprendimento automatico funzionano bene anche con dati non strutturati. Un'enorme quantità di dati può essere facilmente scomposta in informazioni significative tramite tecniche di apprendimento automatico che evidenziano la necessità per i professionisti del database di acquisire competenze di apprendimento automatico.

I database di machine learning sono qui

Aziende come Microsoft e Oracle hanno già iniziato a incorporare diverse capacità di machine learning nei database. Ad esempio, il database SQL di Microsoft Azure ha un modulo che suggerisce e consiglia diverse strategie di miglioramento delle prestazioni che possono essere applicate automaticamente. Allo stesso modo, l'archivio query di SQL Server fornisce un piano per identificare le query che causano colli di bottiglia delle prestazioni. Il database Oracle 18c contiene funzionalità di autoriparazione e può applicare patch automatiche e aggiornarsi ogni volta che si verifica un problema con il database. Una buona conoscenza dell'apprendimento automatico aiuta effettivamente gli sviluppatori di database a comprendere la logica alla base delle diverse raccomandazioni fornite dagli strumenti di database di apprendimento automatico.

L'avvento dei database completamente autonomi

Gli attuali database di machine learning hanno capacità limitate. L'obiettivo della ricerca attuale è lo sviluppo di database completamente automatizzati. Non sarebbe bello avere un database in grado di anticipare i problemi che si verificheranno ed è sufficientemente proattivo da adottare misure preventive in anticipo? O non renderebbe la vita di un professionista del database molto più semplice se il database esegue il backup automatico ogni volta che si verifica una transazione cruciale? Esistono molti scenari in cui i database di machine learning sono estremamente utili.

Ad esempio, i database esistenti eseguono backup automatici in un momento specifico, ma non vale la pena sostenere tutte le transazioni del database. In questo tipo di scenario, i database di machine learning potrebbero diventare abbastanza intelligenti da sapere quando eseguire il backup e quando no.

Inoltre, molti problemi di database possono essere anticipati in anticipo. Ad esempio, negli scenari in cui più utenti accedono a risorse di database diverse, la probabilità di un deadlock aumenta di molte volte. Se ciò accadesse, un database di apprendimento automatico potrebbe passare a fornire un accesso controllato alle risorse ed evitare un deadlock.

Esistono diversi gruppi di ricerca accademici che hanno cercato di sviluppare database completamente autonomi.

Il Carnegie Mellon Database Research Group ha sviluppato il progetto OtterTune che utilizza tecniche di machine learning e dati sui carichi di lavoro da un numero enorme di vecchi database per creare modelli in grado di ottimizzare automaticamente nuovi carichi di lavoro. Il database di machine learning di OtterTune consiglia inoltre automaticamente le impostazioni ottimali per una migliore velocità effettiva e una latenza ridotta per le nuove applicazioni di database.

Il MIT ha anche sviluppato un framework di gestione del database open source chiamato DBSee r che prevede le prestazioni per un determinato insieme di risorse di database e identifica anche i colli di bottiglia delle prestazioni.

Curva di apprendimento

L'apprendimento automatico è spesso definito come l'intersezione tra informatica e statistica. Chiunque abbia conoscenze informatiche può sviluppare in tempi relativamente brevi le proprie capacità di apprendimento automatico a un livello intermedio se sviluppa una ragionevole comprensione delle statistiche.

Molti strumenti GUI e piattaforme cloud come Google AI, IBM Watson, Amazon Sagemaker, Azure ML hanno semplificato il processo di implementazione delle tecniche di machine learning fornendo interfacce di trascinamento della selezione basate su GUI per i database di machine learning. Gli utenti devono solo sapere come utilizzare lo strumento poiché la maggior parte del lavoro (aggiunta di set di dati, selezione di tecniche di pre-elaborazione, formazione del modello e infine valutazione del modello) può essere eseguita con pochi clic del mouse.

Se un professionista del database vuole davvero costruire una carriera nell'apprendimento automatico avanzato, tuttavia, dovrà acquisire una conoscenza approfondita delle statistiche. Il background di informatica di un professionista di database sarà più che sufficiente per comprendere rapidamente i concetti relativi all'apprendimento automatico relativi a CS.

Tuttavia, come abbiamo detto sopra, se un professionista di database è interessato solo all'utilizzo dell'apprendimento automatico per automatizzare attività ripetitive, una conoscenza degli strumenti di apprendimento automatico basati su GUI sarà più che sufficiente.

Percorsi di carriera multipli

Il successo dell'apprendimento automatico e dell'intelligenza artificiale ha spinto le organizzazioni a sviluppare team dedicati alla scienza dei dati contenenti esperti di machine learning qualificati.

Attualmente, gli esperti di machine learning e i professionisti dei database hanno percorsi di carriera diversi, tuttavia sempre più organizzazioni si aspettano che gli esperti di machine learning o data science abbiano un certo livello di esperienza nel database e viceversa.

Dato che questo è attualmente in evoluzione, sono preferiti i professionisti di database con una conoscenza delle capacità di apprendimento automatico e hanno maggiori possibilità di essere assunti come professionisti di database, esperti di apprendimento automatico o qualcuno con entrambe le responsabilità lavorative.

Verdetto finale

È probabile che l'avvento dei big data e delle relative tecniche di apprendimento automatico porti cambiamenti sostanziali nelle responsabilità lavorative dei professionisti dei database poiché nel tempo la loro attenzione si sposterà sui dati del database, poiché i database di apprendimento automatico si gestiscono sempre più da soli.

L'apprendimento automatico aiuterà i professionisti dei database ad automatizzare molte attività manuali e laboriose e li libererà per investire tempo e fatica per abbracciare le abilità di apprendimento automatico e metterle in pratica.

Imparare le statistiche necessarie per passare da un professionista di database a un database più ampio e l'apprendimento automatico non è semplice, ma pagherà grandi dividendi in termini di crescita professionale e opportunità.