13.1 Installation et configuration de CDH

Cette section fournit des informations sur les paramètres spécifiques requis pour Sentinel lors de l'installation et de la configuration de CDH. Pour obtenir des informations détaillées sur l'installation et la configuration de CDH, reportez-vous à la version certifiée détaillée dans la documentation de Cloudera.

Sentinel fonctionne avec Cloudera Express, la version gratuite de CDH. Sentinel fonctionne également avec Cloudera Enterprise, qui nécessite l'achat d'une licence auprès de Cloudera et inclut de nombreuses fonctionnalités non disponibles dans l'édition Cloudera Express. Si vous choisissez de commencer par Cloudera Express et découvrez ensuite que vous avez besoin des fonctionnalités proposées dans Cloudera Enterprise, vous pouvez mettre à niveau la grappe après l'achat de la licence auprès de Cloudera.

13.1.1 Conditions préalables

Avant d'installer CDH, vous devez configurer les hôtes en respectant les conditions préalables suivantes :

  • Veillez à respecter les conditions préalables mentionnées dans la documentation de Cloudera.

  • Pour de meilleures performances, utilisez le système de fichiers ext4 ou XFS.

  • CDH nécessite quelques paquets de système d'exploitation qui ne sont pas installés par défaut. Par conséquent, vous devez monter le DVD du système d'exploitation correspondant. Les instructions d'installation Cloudera vous guident pour déterminer les paquets à installer.

  • Pour les systèmes d'exploitation SLES, CDH requiert le paquet python-psycopg2. Installez le paquet python-psycopg2. Pour plus d'informations, consultez la documentation d'openSUSE.

  • Si vous utilisez des machines virtuelles, réservez l'espace disque requis sur le système de fichiers lorsque vous créez des nœuds de machine virtuelle. Par exemple, sous VMware, vous pouvez utiliser le provisioning lourd.

  • Assurez-vous que les nœuds de grappe Sentinel et CDH se trouvent dans le même fuseau horaire.

  • Définissez le paramètre swappiness de tous les hôtes sur 1 dans le fichier /etc/sysctl.conf en ajoutant l'entrée suivante :

    vm.swappiness=1

    Pour appliquer ce paramètre immédiatement, exécutez la commande suivante :

    sysctl -p
  • La version du JDK dans CDH doit au minimum être identique à celle utilisée dans Sentinel. Si la version du JDK disponible dans CDH est antérieure à celle de Sentinel, vous devez suivre les instructions pour installer le JDK manuellement au lieu d'installer le JDK disponible dans l'espace de stockage CDH.

    Installez JDK à l'aide du fichier binaire d'archivage (.tar.gz) car l'installation du RPM JDK est problématique lors de l'utilisation du script manage_spark_jobs.sh pour soumettre des jobs Spark sous YARN.

    Pour déterminer la version du JDK utilisée dans Sentinel, consultez les Notes de version de Sentinel.

13.1.2 Installation et configuration de CDH

Installez la version certifiée de CDH. Pour plus d'informations sur la version certifiée de CDH, reportez-vous à la page Technical Information for Sentinel (Informations techniques pour Sentinel). Reportez-vous à la version certifiée dans la documentation de Cloudera pour obtenir des instructions d'installation.

Pendant l'installation de CDH, procédez comme suit :

  • (Conditionnel) Si l'installation échoue pendant l'installation de la base de données PostgreSQL intégrée, procédez comme suit :

    mkdir -p /var/run/postgresql

    sudo chown cloudera-scm:cloudera-scm /var/run/postgresql

  • Lorsque vous choisissez le type d'installation logiciel dans la fenêtre Select Repository (Sélectionner un espace de stockage), veillez à ce que l'option Use Parcels (Utiliser les paquets) soit sélectionnée et choisissez Kafka dans Additional Parcels (Paquets supplémentaires).

  • Lorsque vous ajoutez des services, veillez à activer les services suivants :

    • Cloudera Manager

    • ZooKeeper

    • HDFS

    • HBase

    • YARN

    • Spark

    • Kafka

    REMARQUE :Le serveur d'historique Spark et HDFS NameNode doivent être installés sur le même nœud pour assurer la fiabilité du système. Pour plus d'informations sur l'architecture de stockage évolutif, consultez Planification du stockage évolutif.

    Lorsque vous activez les services ci-dessus, configurez la haute disponibilité pour les composants suivants :

    • HBase HMaster

    • HDFS NameNode

    • YARN ResourceManager

  • (Conditionnel) Si le programme d'installation ne déploie pas la configuration du client en raison d'un chemin Java manquant, ouvrez une nouvelle session du navigateur et mettez à jour manuellement le chemin d'accès à Java comme suit :

    Cliquez sur Hosts (Hôtes) > All Hosts (Tous les hôtes) > Configuration et spécifiez le chemin d'accès correct dans le champ Java Home Directory (Répertoire privé Java).