Mysql
 sql >> Database >  >> RDS >> Mysql

Metastore hive esterno per EMR

Puoi ignorare le configurazioni predefinite per le applicazioni fornendo un oggetto di configurazione per le applicazioni quando crei un cluster. L'oggetto di configurazione è referenziato come un file JSON. Gli oggetti di configurazione sono costituiti da una classificazione, proprietà e configurazioni nidificate facoltative. Le proprietà sono le impostazioni che vuoi modificare in quel file. Puoi specificare più classificazioni per più applicazioni in un singolo oggetto JSON.

Per sovrascrivere hive-site.xml con le informazioni del metastore mysql esterno, crea un file di configurazione chiamato hiveConfiguration.json contenente le modifiche a hive-site.xml:

[
    {
      "Classification": "hive-site",
      "Properties": {
        "javax.jdo.option.ConnectionURL": "jdbc:mysql:\/\/hostname:3306\/hive?createDatabaseIfNotExist=true",
        "javax.jdo.option.ConnectionDriverName": "org.mariadb.jdbc.Driver",
        "javax.jdo.option.ConnectionUserName": "username",
        "javax.jdo.option.ConnectionPassword": "password"
      }
    }
]

Utilizza hiveConfiguration.json con il seguente comando AWS CLI per creare il cluster:

aws emr create-cluster --release-label emr-5.11.0 --instance-type m3.xlarge --instance-count 2 \
--applications Name=Hive --configurations ./hiveConfiguration.json --use-default-roles

Riferimento :

https://docs.aws.amazon .com/emr/latest/ReleaseGuide/emr-hive-metastore-external.html