HBase
 sql >> Database >  >> NoSQL >> HBase

Guida introduttiva al database operativo (COD) della piattaforma dati Cloudera

Concetti

Cos'è Cloudera Operational Database (COD)?

Il database operativo è un database relazionale e non relazionale basato su Apache HBase ed è progettato per supportare le applicazioni OLTP, che utilizzano i big data.

Il database operativo in Cloudera Data Platform ha i seguenti componenti: 

  • Apache Phoenix fornisce un modello relazionale che facilita un'enorme scalabilità. Sfrutta la scalabilità e la resilienza di Apache HBase.
  • Apache HBase fornisce un modello non relazionale progettato per un'enorme scalabilità, in modo da poter archiviare quantità illimitate di dati in un'unica piattaforma e gestire la crescente domanda di servizi di dati.
  • Apache ZooKeeper fornisce un servizio di configurazione distribuito, un servizio di sincronizzazione e un registro dei nomi.
  • Apache Knox Gateway fornisce sicurezza perimetrale in modo che l'azienda possa estendere con sicurezza l'accesso a nuovi utenti.
  • Apache HDFS viene utilizzato per scrivere Apache HBase WAL (e HBase HFile in alcuni casi).
  • Gli archivi di oggetti come Amazon S3 e Microsoft ADLS Gen2 vengono utilizzati per archiviare gli HFile Apache HBase.
  • Shared Data Experience (SDX) viene utilizzato per le funzionalità di sicurezza e governance. Le politiche di sicurezza e governance vengono impostate una volta e applicate a tutti i dati e ai carichi di lavoro. Proprio come CDP stesso, SDX è basato su progetti open source della comunità con Apache Ranger e Apache Atlas al primo posto.

Atlas fornisce funzionalità di governance e gestione dei metadati aperte per creare un catalogo di tutte le risorse e anche classificare e governare queste risorse. Il livello SDX di CDP sfrutta l'intero spettro di Atlas per tracciare e controllare automaticamente tutte le risorse di dati.

Ranger fornisce la gestione delle chiavi di sicurezza, con un accesso separato per gli amministratori delle chiavi che utilizzano il servizio Ranger KMS. Apache Ranger fornisce anche funzionalità di sicurezza molto necessarie come il mascheramento delle colonne e il filtraggio delle righe pronto all'uso. Un altro fattore importante è che le politiche di accesso in Ranger possono essere personalizzate con un contesto dinamico utilizzando attributi diversi come "regione geografica" o "ora del giorno".

  • IDBroker è un'API REST creata come parte dei servizi di autenticazione di Apache Knox. Consente a un utente autenticato e autorizzato di scambiare un set di credenziali o un token per i token di accesso del fornitore cloud.

Servizio dati database operativo CDP

CDP Operational Database (COD) è un database operativo con scalabilità automatica in tempo reale basato su Apache HBase e Apache Phoenix. È un servizio dati che funziona su Cloudera Data Platform (CDP). Puoi accedere a COD direttamente dalla tua console CDP. COD ti consente di creare un nuovo database operativo con un solo clic e di ridimensionare automaticamente in base al tuo carico di lavoro.

Di seguito sono riportati i passaggi chiave per iniziare con COD:

  • Crea un database in un ambiente usando un solo clic e un database dovrebbe essere attivo e disponibile in pochi minuti.
  • Imposta la password del carico di lavoro. Per maggiori informazioni, clicca qui.
  • Scarica e installa Apache Maven, Java, Python 3.8.
  • Installa il client CDP sul tuo computer. Per ulteriori informazioni, fare clic qui.
  • Segui le istruzioni nel repository degli esempi per apportare modifiche a settings-security.xml, settings.xml e pom.xml.
  • Crea ed esegui le applicazioni.

Apache HBase

HBase è un'architettura di archiviazione dei dati orientata alle colonne che viene formata su HDFS per superarne i limiti. Sfrutta le funzionalità di base di HDFS e si basa su di essa per fornire scalabilità gestendo un grande volume di richieste di lettura e scrittura in tempo reale. Sebbene l'architettura HBase sia un database NoSQL, semplifica il processo di gestione dei dati distribuendoli uniformemente nel cluster. Ciò rende veloce l'accesso e la modifica dei dati nel modello di dati HBase. Ulteriori informazioni su Apache HBase.

Apache Phoenix

Apache Phoenix è un'interfaccia RDBMS e ANSI SQL. Apache Phoenix implementa ottimizzazioni delle migliori pratiche per consentire agli ingegneri del software di sviluppare applicazioni basate sui dati di nuova generazione basate su HBase. Utilizzando Phoenix, puoi creare e interagire con le tabelle sotto forma di tipiche istruzioni DDL/DML utilizzando l'API JDBC standard, ODBC e l'API Phoenix DB.

Phoenix fornisce:

  • Supporto per API SQL e JDBC
  • Supporto per schema in lettura ritardato
  • Accesso ai dati archiviati e prodotti in altri componenti come Apache Spark e Apache Hive

Ulteriori informazioni su Apache Phoenix.

Procedura

Come creare un database operativo

Puoi creare un database operativo nel tuo ambiente registrato utilizzando CDP Operational Database (COD).

Prerequisiti

  • Devi essere loggato nell'ambiente COD come ODAdmin.
  • Assicurati di essere autorizzato a creare un database.

Passaggi

  1. Accedi all'interfaccia web di CDP. Ad esempio, console CDP.
  2. Seleziona Database Operativo.
  3. Nell'interfaccia web di COD, fai clic su Crea database.
  4. Seleziona l'ambiente dall'elenco in cui desideri avere il database.
  5. Fornire un nome per il database nel campo Nome database.
  6. Fai clic su Crea database.

Risultato

Viene visualizzata la pagina delle informazioni che mostra lo stato del database. Il tuo nuovo database è pronto per essere utilizzato una volta che il suo stato diventa Disponibile.

Dimostrazione

Come gestire una connessione al database

Dopo aver creato un database operativo ed averlo reso disponibile, puoi gestire le connessioni al database.

Prerequisiti

  • Assicurati che un database sia attivo e disponibile.
  • Sei autorizzato ad apportare modifiche al database.

Passaggi

  1. Nell'interfaccia web di COD, seleziona il database di cui vuoi gestire le connessioni.
  2. In Connetti, vai all'interno di ogni scheda e modifica i parametri.

Riferimenti

  • Documentazione Cloudera sulla creazione di un database COD
  • Database operativo in CDP 

Se sei interessato a provare CDP Public Cloud e il Database Operativo, prova il nostro Test drive .