Database
 sql >> Database >  >> RDS >> Database

Analizza i Big Data con gli strumenti di Microsoft Azure

Big Data

Big Data descrive il grande volume di dati, strutturati o non strutturati, che inonda quotidianamente un'azienda. I Big Data trattano modi per analizzare, estrarre informazioni o gestire set di dati troppo grandi o complessi per essere gestiti da normali software di elaborazione dati.

I big data hanno le seguenti caratteristiche:

  • Volume: La quantità di dati generati e memorizzati
  • Varietà: Il tipo e la natura dei dati
  • Velocità: La velocità con cui i dati vengono generati ed elaborati
  • Verità: Qualità dei dati e valore dei dati

L'influenza di Azure sui Big Data

Microsoft Azure trasforma i dati in informazioni dettagliate utilizzabili tramite strumenti di machine learning. Ti consente di combinare qualsiasi dato su qualsiasi scala e di creare e distribuire modelli di machine learning su larga scala.

Con i seguenti prodotti Azure, è possibile eseguire analisi avanzate su Big Data:

  • Data Warehouse SQL
  • Fabbrica di dati
  • Archiviazione BLOB di Azure
  • Databrick di Azure
  • Azure Cosmos DB
  • Power BI

Diamo un'occhiata a ciascuno di essi singolarmente.

Data Warehouse SQL

SQL Data Warehouse è un EDW (Enterprise Data Warehouse) basato su cloud che utilizza Massively Parallel Processing (un gran numero di processori che eseguono una serie di calcoli in parallelo) per eseguire query complesse su petabyte di dati.

Importi semplicemente i big data in SQL Data Warehouse con query PolyBase T-SQL (query che leggono i dati da Hadoop), quindi, con la potenza di MPP, esegui analisi ad alte prestazioni. Il data warehouse diventerà quindi l'unica versione della verità su cui puoi contare per approfondimenti.

Fabbrica di dati

Data Factory è un servizio di integrazione dei dati nel cloud che compone servizi di archiviazione, spostamento ed elaborazione dei dati in pipeline di dati automatizzate. Azure Data Factory è un servizio di integrazione dei dati ibrido che consente di creare, pianificare e orchestrare flussi di lavoro ETL/ELT (estrazione, trasformazione, caricamento).

Archiviazione BLOB di Azure

Archiviazione BLOB di Azure è un archivio di oggetti estremamente scalabile per documenti, immagini, video e audio non strutturati. L'archiviazione BLOB di Azure è ottimizzata per l'archiviazione di enormi quantità di dati non strutturati (dati che non aderiscono a un particolare modello di dati o definizione), ad esempio dati di testo o binari.

L'archiviazione BLOB di Azure ha le funzioni seguenti:

  • Servire documenti o immagini direttamente su un browser
  • Memorizzazione di file per l'accesso distribuito
  • Streaming di audio e video
  • Scrittura sui file di registro
  • Archiviazione dei dati per ripristino di emergenza, backup e ripristino e archiviazione

Azure Databrick

Azure Databricks è una piattaforma di analisi semplice, veloce e collaborativa basata su Apache Spark (quadro di calcolo di cluster per uso generale distribuito open source, che fornisce un'interfaccia per la programmazione di cluster con parallelismo dei dati implicito).

Azure Cosmos DB

Azure Cosmos DB è un servizio di database distribuito a livello globale. È progettato per fornire bassa latenza, scalabilità elastica del throughput, semantica ben definita per la coerenza dei dati e disponibilità elevata.

Power BI

Power BI è una suite di strumenti di analisi aziendale che forniscono informazioni dettagliate. Power BI ti consente di connetterti a decine di origini dati, semplificare la preparazione dei dati, promuovere analisi ad hoc e produrre report da utilizzare sul Web e su dispositivi mobili.

Conclusione

I Big Data si sono evoluti e continuano a evolversi. Con l'aiuto degli strumenti di Azure, i Big Data diventano sempre più gestibili.