Procedura:Aggiungi Cloudera Search al tuo cluster utilizzando Cloudera Manager

Cloudera Manager 4.7 ha aggiunto il supporto per la gestione di Cloudera Search 1.0. In questo modo gli utenti di Cloudera Manager possono facilmente distribuire tutti i componenti di Cloudera Search (incluso Apache Solr) e gestire tutti i servizi correlati, proprio come ogni altro servizio incluso in CDH (distribuzione di Apache Hadoop e progetti correlati di Cloudera).

In questa procedura imparerai i passaggi necessari per aggiungere Cloudera Search a un cluster Cloudera Enterprise (CDH + Cloudera Manager).

Installazione del pacchetto SOLR

Nel nostro esempio, il cluster utilizza un pacchetto CDH 4.4 ed esegue i servizi Apache ZooKeeper, HDFS e Apache HBase. (I pacchi sono un modo davvero utile per distribuire nuovo software ed eseguire aggiornamenti indolori tramite Cloudera Manager.)

Se desideri scaricare il pacco SOLR direttamente da Cloudera, puoi utilizzare le impostazioni predefinite per "URL repository di pacchi remoti" (sotto i Pacchi sezione nella scheda Amministrazione) come mostrato di seguito:

Impostazione dell'URL del repository dei pacchi

Se desideri utilizzare un repository locale (ovvero scaricare prima il pacchetto da Cloudera e poi installarlo dalla copia locale), puoi seguire le istruzioni qui. I passaggi successivi sono "Scarica", "Distribuisci" e "Attiva" il pacco dalla pagina Pacchi nella scheda Host.

Distribuzione del pacchetto SOLR

Una volta attivato il pacco, hai tutti i componenti di Cloudera Search (Solr, Lily HBase Indexer e Apache Flume's Morphlines Sink) pronti per essere utilizzati insieme a CDH.

Il passaggio successivo consiste nell'aggiungere il servizio Apache Solr al cluster. Nel menu "Azioni" del tuo cluster nella scheda Servizi, scegli "Aggiungi un servizio", che ti porta alla "Installazione guidata servizio" in Cloudera Manager. Dopo aver seguito i passaggi della procedura guidata e aver scelto dove eseguire i server Solr, atterrerai su una pagina del flusso di lavoro che inizializzerà il servizio Solr e avvierà tutti i server Solr.

Rendere operativo il servizio Solr

Ecco fatto:il servizio Solr è ora pronto per l'uso! Segui le istruzioni nella Guida per l'utente di Cloudera Search per creare raccolte e aggiungervi documenti per l'indicizzazione. Lo screenshot seguente mostra come creare una raccolta utilizzando lo schema Solr predefinito.

Creazione della prima raccolta

Aggiunta di Lily HBase Indexer

Cloudera Manager 4.7 fornisce anche supporto per Lily HBase Indexer incluso con il pacchetto SOLR. Lily HBase Indexer Service è un sistema flessibile, scalabile, tollerante ai guasti, transazionale e quasi in tempo reale per l'elaborazione di un flusso continuo di aggiornamenti delle celle HBase in indici di ricerca in tempo reale. Per utilizzarlo, aggiungi il servizio "Keystore Indexer" tramite la "Installazione guidata servizio".

Prima di poter utilizzare Lily HBase Indexer, tuttavia, è necessario assicurarsi che la replica e l'indicizzazione siano abilitate nel servizio HBase nel cluster. Puoi modificare queste proprietà nella pagina di configurazione del servizio HBase nella sezione "Backup".

Impostazione delle proprietà HBase per Lily HBase Indexer

Inoltre, tieni presente che Cloudera Manager include un file Cloudera Morphlines predefinito che può essere utilizzato da Lily HBase Indexer. Per modificare quel file per utilizzare le tue funzioni, devi accedere al servizio Keystore Indexer e modificare la configurazione Morphlines come mostrato di seguito:

Modifica delle morfoline di Cloudera per Lily HBase Indexer

Una volta apportate queste modifiche, puoi iniziare a utilizzare Lily HBase Indexer per indicizzare tutti i dati in arrivo in HBase seguendo le istruzioni nella Guida per l'utente di Lily HBase Indexer . Questo post del blog fornisce anche un ottimo esempio di come indicizzare le email utilizzando HBase e Cloudera Search.

Conclusione

Ora sai quanto è facile distribuire, configurare e gestire un servizio Cloudera Search nel tuo cluster CDH utilizzando Cloudera Manager. A partire da Cloudera Enterprise 5 (in versione beta al momento della scrittura), Cloudera Search e Lily HBase indexer verranno installati e avviati per impostazione predefinita, rendendo questo processo ancora più semplice.

Vikram Srivastava è un ingegnere del software presso Cloudera.