Nota del redattore, agosto 2020:CDP Data Center è ora chiamato CDP Private Cloud Base. Puoi saperne di più qui.
Il database operativo (OpDB) di Cloudera in CDP offre un OpDB scalabile, sempre disponibile e in tempo reale che serve i dati strutturati tradizionali insieme ai nuovi dati non strutturati all'interno di una piattaforma operativa e di magazzino unificata. Cloudera fornisce un database operativo che serve i dati strutturati tradizionali insieme ai nuovi dati non strutturati all'interno di una piattaforma open source unificata.
Il database operativo ti aiuta a:
Rendere operativo l'apprendimento automatico/intelligenza artificiale per rivoluzionare settori come l'assistenza sanitaria, i servizi di pubblica utilità, ecc.
- Offri contenuti in tempo reale su scala web.
- Potenzia l'analisi dei big data per usi operativi e offline.
- Utilizza come archivio resiliente di record.
OpDB in CDP è attualmente disponibile in due fattori di forma:come offerta completamente sicura e semi-gestita in CDP Public Cloud – Data Hub e come offerta completamente personalizzabile in CDP Data Center – simile a quanto è già disponibile in CDH e HDP. Puoi scegliere un fattore di forma in base alla tua strategia di distribuzione e alle esigenze di OpDB. Il database operativo utilizza un archivio oggetti come Amazon S3 come livello di archiviazione per Apache HBase, in cui i file H vengono scritti nell'archivio oggetti, ma i file WAL vengono scritti su HDFS.
Il database operativo in CDP ha i seguenti componenti:
- Apache Phoenix un'interfaccia SQL che gira su Apache HBase.
- Apache HBase è progettato per un'enorme scalabilità, quindi puoi archiviare quantità illimitate di dati in un'unica piattaforma e gestire la crescente domanda di servizi di dati.
- Apache ZooKeeper fornisce un servizio di configurazione distribuito, un servizio di sincronizzazione e un registro dei nomi.
- Apache Knox Gateway fornisce sicurezza perimetrale in modo che l'azienda possa estendere con sicurezza l'accesso a nuovi utenti.
- Apache HDFS viene utilizzato per scrivere i WAL HBase di Apache.
- L'archivio oggetti come Amazon S3 e Microsoft ADLS Gen2 viene utilizzato per archiviare gli HFiles Apache HBase.
- Shared Data Experience (SDX) viene utilizzato per le funzionalità di sicurezza e governance. Le politiche di sicurezza e governance vengono impostate una volta e applicate a tutti i dati e carichi di lavoro.
- IDBroker è un'API REST creata come parte dei servizi di autenticazione di Apache Knox. Consente a un utente autenticato e autorizzato di scambiare un set di credenziali o un token per i token di accesso del fornitore cloud.
Database operativo nella serie CDP
Questo articolo ti ha fornito un'introduzione su OpDB su CDP e la sua architettura. Puoi saperne di più su ogni aspetto di OpDB e scoprire le nuove funzionalità e capacità di OpDB nei prossimi articoli di questa serie. Aggiorneremo i collegamenti a ciascun post del blog man mano che vengono pubblicati.
Accessibilità
L'OpDB di Cloudera garantisce che gli utenti possano accedere o recuperare i dati archiviati. Supporta sia il partizionamento orizzontale automatico che il partizionamento orizzontale predefinito, tre motori di query e diversi strumenti di integrazione dei dati. In questo articolo viene fornita una panoramica di queste funzionalità e di altre funzionalità che garantiscono il raggiungimento di un elevato livello di accessibilità.
Amministrazione
OpDB di Cloudera fornisce diversi strumenti e funzionalità di amministrazione per amministrare il carico di lavoro OpDB. Gli amministratori possono implementare OpDB come offerta semi-gestita completamente sicura in CDP Public Cloud – Data Hub e come offerta completamente personalizzabile in CDP Data Center (simile a ciò che è disponibile in CDH e HDP). Questo articolo fornisce una panoramica di alto livello di quali funzionalità e strumenti sono supportati per amministrare OpDB in CDP.
Gestione
OpDB di Cloudera fornisce strumenti di gestione che ti aiutano a gestire in modo efficace i tuoi carichi di lavoro OpDB. Questo articolo offre una panoramica degli strumenti e delle funzionalità di gestione di OpDB in CDP.
Disponibilità
L'OpDB di Cloudera mantiene un elevato livello di disponibilità dei dati, assicurando che i dati richiesti siano accessibili quando e dove necessario, anche in caso di guasto del nodo. Questo articolo fornisce una panoramica delle funzionalità che rendono possibile un elevato livello di disponibilità, come la disponibilità immediata, la replica dei dati e la protezione dagli errori.
Integrità
L'OpDB di Cloudera offre varie funzionalità di integrità dei dati, tra cui integrità di entità e dominio, transazioni ACID e integrità non relazionale. Questo articolo fornisce una panoramica delle funzionalità di integrità dei dati OpDB.
Supporto per l'applicazione
L'OpDB di Cloudera supporta vari linguaggi, framework e applicazioni popolari che puoi utilizzare per accedere ai dati archiviati nel tuo OpDB. Questo articolo offre una panoramica dei linguaggi, dei framework e delle applicazioni supportati.
NoSQL e funzionalità correlate
Poiché OpDB di Cloudera include il database NoSQL HBase per archiviare i dati, ha funzionalità NoSQL, come valori chiave, funzionalità in stile tabella e tipi di dati flessibili. Viene fornita anche una stretta integrazione nell'ecosistema Hadoop, inclusi HDFS, Spark e Kafka. Questo articolo fornisce una panoramica di queste funzionalità.
Scalabilità
L'OpDB di Cloudera è progettato per un'elevata scalabilità, supportando sia la scalabilità verticale che quella orizzontale con un tipo di dati flessibile e nessun limite alla dimensione dei dati. Questo articolo fornisce una panoramica delle funzionalità e degli strumenti relativi alla scalabilità supportata.
Sicurezza
OpDB di Cloudera fornisce molteplici soluzioni di sicurezza a diversi livelli, per quanto riguarda crittografia, autenticazione, autorizzazione e audit. Questo articolo fornisce una panoramica di queste funzionalità e strumenti relativi alla sicurezza.
Per ulteriori informazioni, visitare:Guida introduttiva al database operativo.