Installer l'application Looker

Cette page explique comment installer l'application Looker pour un déploiement hébergé par le client.

L'hébergement de l'application Looker est indépendant de l'emplacement de vos données. Les données restent toujours dans la base de données et ne sont pas copiées dans l'instance Looker.

Spécifications de déploiement

Si vous prévoyez d'exécuter Looker sur un réseau qui ne se connecte pas à Internet, vous devrez peut-être configurer un serveur proxy pour communiquer avec le serveur de licences Looker ou utiliser des services Web sans serveur qui n'effectuent que des appels Web, tels que BigQuery.

Installez l'application Looker sur une machine dédiée qui répond aux exigences minimales suivantes :

  • Processeur 1,2 GHz (Looker recommande deux cœurs ou plus).
  • 8 Go de RAM disponible.
  • 10 Go d'espace disque disponible.
  • 2 Go d'espace pour le fichier d'échange.
  • Linux. Nous utilisons Ubuntu Linux (versions LTS) pour notre hébergement Looker interne et nous le recommandons aux clients qui n'ont pas de préférence pour Linux. Toutefois, nous acceptons Looker sur les versions de toutes les principales distributions Linux pour les entreprises, y compris RedHat, CentOS et Amazon Linux. Looker n'est compatible qu'avec les versions Linux dotées de jeux d'instructions x64.
  • Java OpenJDK 11.0.12+ ou HotSpot 1.8 update 161+. Looker utilise OpenJDK (version 11) pour améliorer les performances et l'utilisation de la mémoire. Looker recommande le JDK plutôt que le JRE pour profiter des outils de dépannage supplémentaires. Looker vous recommande également de passer aux nouvelles mises à jour Java dès qu'elles sont disponibles. Les autres versions de Java, Oracle JDK et OpenJDK ne sont pas compatibles pour le moment.

  • libssl et libcrypt.so doivent être présents sur le système.

  • Vous devez autoriser le trafic entrant vers votre instance Looker via le port TCP 9999.

  • Si les utilisateurs ont besoin d'accéder à l'API, vous devez autoriser le trafic entrant vers votre instance Looker via le port TCP 19999.

  • Si Looker se connecte à AWS Redshift depuis un réseau privé AWS VPC, vous devez définir la MTU sur 1 500. Pour en savoir plus sur ce paramètre, consultez la section Configuration de la MTU d'une instance de cet article Amazon Web Services. Si Looker détecte que le paramètre MTU est supérieur à 1 500 lors d'un test de connexion à la base de données, il affiche l'erreur suivante :

    MTU of network interface eth0 is too large (> 1500).
    If Looker instance and Redshift cluster are within the same VPC,
    this warning can be ignored.
    
  • Les paramètres de keepalive TCP suivants. Pour que ces paramètres persistent après un redémarrage, ils doivent être définis dans /etc/sysctl.conf ou dans un fichier du répertoire /etc/sysctl.d :

    net.ipv4.tcp_keepalive_time=200
    net.ipv4.tcp_keepalive_intvl=200
    net.ipv4.tcp_keepalive_probes=5
    
  • Un utilisateur nommé looker dans le groupe nommé looker pour exécuter l'application Looker.

  • Une limite ulimit pour l'utilisateur looker de 4096 ou plus. Pour ce faire, ajoutez les lignes suivantes à /etc/security/limits.conf :

    looker     soft     nofile     4096
    looker     hard     nofile     4096
    
  • Synchronisation de l'heure via NTP ou un protocole équivalent.

  • Le dossier /tmp ne doit pas être installé avec l'option noexec.

  • Le répertoire personnel looker ne doit pas être installé sur un volume NFS.

  • Il est recommandé, mais pas obligatoire, de définir le fuseau horaire du serveur sur UTC.

  • Git 2.39.1 ou version ultérieure est requis pour Looker 23.6 et versions ultérieures.

  • Bien que cela ne soit pas obligatoire, Netcat peut être utile pour résoudre les problèmes de connectivité réseau. Pour installer Netcat sur un serveur basé sur Ubuntu, par exemple, une commande courante est la suivante :

    sudo apt-get install netcat
    
  • Si nécessaire, vous pouvez configurer un serveur proxy pour gérer les requêtes HTTP(S) que Looker doit pouvoir envoyer au "core" sur localhost. Pour communiquer avec le serveur proxy local Looker, vous devez ajouter des arguments spéciaux dans lookerstart.cfg : ajoutez http.nonProxyHosts=localhost pour activer l'accès à l'hôte local Looker sans passer par le proxy.

Pour éviter les conflits de maintenance et de ressources, n'utilisez pas le serveur Looker pour héberger d'autres applications.

Activer ntpd ou chronyd

NTP est l'abréviation de Network Time Protocol (protocole de temps réseau). Il permet à l'horloge système de votre hôte de toujours afficher la bonne heure, ce dont Looker a besoin pour fonctionner correctement. Looker n'exige pas l'utilisation d'un logiciel de synchronisation horaire particulier, à condition que les heures restent synchronisées. Il n'est pas nécessaire d'exécuter un serveur NTP. Seul le client NTP est requis. Vous pouvez remplacer chronyd par NTP.

Consultez la documentation de votre fournisseur d'OS pour savoir comment activer ntpd ou chronyd.

Créer une clé de chiffrement

Looker utilise le chiffrement AES-256 en mode GCM (Galois/Counter Mode) pour chiffrer les données sensibles stockées en interne, y compris :

  • Sauvegardes de la base de données interne de Looker
  • Informations de connexion aux bases de données et aux services
  • Informations d'authentification des utilisateurs
  • Valeurs des attributs utilisateur
  • Données client mises en cache ou préparées pour la livraison

Pour obtenir la liste détaillée des données chiffrées par Looker, ouvrez une demande d'assistance.

Les données sont chiffrées à l'aide d'une clé de données unique et contiennent une enveloppe de chiffrement signée et versionnée pour garantir la validation. Ce mode nécessite l'utilisation d'une clé maîtresse client (CMK) externe. La CMK est utilisée pour dériver, chiffrer et déchiffrer la clé de chiffrement de clé (KEK), qui est elle-même utilisée pour dériver, chiffrer et déchiffrer les clés de données.

Le chiffrement n'est utilisé que pour la base de données et le cache internes de Looker. Les bases de données client ne sont en aucun cas affectées par le chiffrement Looker. De plus, seules les données statiques (données stockées sur le disque) sont chiffrées de cette manière.

Les installations hébergées par le client peuvent utiliser leurs propres comptes AWS KMS ou leurs propres systèmes de gestion de clés personnalisés. Toutes les clés de données et la KEK sont chiffrées et utilisées en interne sur l'installation Looker hébergée par le client. Si vous n'utilisez pas AWS KMS, la CMK externe doit être conservée dans un emplacement sûr et permanent. Si vous perdez la CMK après avoir chiffré la base de données interne, vous risquez de perdre votre instance.

Si vous utilisez AWS KMS

Si vous utilisez AWS KMS, créez une CMK à l'aide de la console de gestion AWS ou de l'API.

Après avoir créé la clé CMK, Looker vous recommande de créer un rôle IAM unique pour votre clé CMK et de l'associer à votre instance Looker.

Vous trouverez ci-dessous un exemple de rôle IAM contenant les autorisations minimales requises pour votre CMK :

{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Sid": "VisualEditor0",
            "Effect": "Allow",
            "Action": "kms:GenerateRandom",
            "Resource": "*"
        },
        {
            "Sid": "VisualEditor1",
            "Effect": "Allow",
            "Action": [
                "kms:Decrypt",
                "kms:Encrypt",
                "kms:Generate*",
            ],
            "Resource": "arn:aws:kms:*:*:key/*"
        }
    ]
}

Après avoir créé votre CMK et votre nouveau rôle IAM, définissez la variable d'environnement AWS_REGION sur votre région AWS et la variable d'environnement LKR_AWS_CMK sur l'alias de votre CMK :

export AWS_REGION=<AWS_region>
export LKR_AWS_CMK=alias/<CMK_alias>

Vous pouvez également définir la variable d'environnement LKR_AWS_CMK_EC pour définir un contexte de chiffrement AWS personnalisé. Si vous ne définissez pas cette variable d'environnement, Looker utilisera le contexte de chiffrement par défaut, à savoir la chaîne Looker_Encryption_Context.

export LKR_AWS_CMK_EC=<My_Encryption_Context>

Si vous n'utilisez pas AWS KMS

Si vous n'utilisez pas AWS KMS, générez une CMK Base64 de 32 octets. Vous pouvez stocker la CMK dans une variable d'environnement ou dans un fichier :

  • Pour générer la clé CMK et la stocker dans une variable d'environnement, vous pouvez utiliser la commande suivante :

    openssl rand -base64 32
    

    Une fois la clé CMK générée, copiez-la et utilisez la commande suivante pour la stocker dans la variable d'environnement LKR_MASTER_KEY_ENV (où <CMK_value> correspond à la clé CMK que vous avez générée avec la commande précédente) :

    export LKR_MASTER_KEY_ENV=<CMK_value>
    
  • Pour générer et stocker la clé CMK dans un fichier, vous pouvez utiliser la commande suivante (où <path_to_key_file> correspond au chemin d'accès et au nom de fichier pour stocker la clé CMK) :

    openssl rand -base64 32 > <path_to_key_file>
    

    Après avoir généré le fichier CMK, définissez les autorisations du fichier clé sur "Lecture seule" pour l'utilisateur actuel :

    chmod 0400 <path_to_key_file>
    

Une fois la clé CMK générée, veillez à la stocker dans un emplacement sûr et permanent avant de continuer. Si vous perdez la CMK après avoir chiffré la base de données interne, vous risquez de perdre votre instance.

Une fois que vous avez généré et stocké votre CMK, définissez la variable d'environnement LKR_MASTER_KEY_ENV :

  • Si vous stockez votre CMK dans une variable d'environnement, définissez la variable d'environnement LKR_MASTER_KEY_ENV sur la valeur de la CMK :

    export LKR_MASTER_KEY_ENV=<CMK_value>
    
  • Si vous stockez votre CMK dans un fichier, définissez la variable d'environnement LKR_MASTER_KEY_FILE sur le chemin d'accès au fichier CMK :

    export LKR_MASTER_KEY_FILE=<path_to_key_file>
    

Une fois la clé CMK générée, veillez à la stocker dans un emplacement sûr et permanent avant de continuer. Si vous perdez la CMK après avoir chiffré la base de données interne, vous risquez de perdre votre instance.

Installer l'application Looker

  1. Crée un groupe looker.

    sudo groupadd looker
    
  2. Créez l'utilisateur looker et son répertoire personnel.

    sudo useradd -m  -g looker  looker
    
  3. Passez à l'utilisateur looker. N'exécutez pas Looker en tant que root.

    sudo su - looker
    
  4. Créez un sous-répertoire looker dans le répertoire d'accueil.

    mkdir ~/looker
    
  5. Accédez au sous-répertoire looker.

    cd ~/looker
    
  6. Assurez-vous d'être dans le bon répertoire.

    pwd
    

    Si vos répertoires utilisateur se trouvent sous /home, le résultat de cette commande doit être /home/looker/looker.

  7. Téléchargez les fichiers JAR Looker choisis à l'aide de l'une des méthodes décrites sur la page de documentation Télécharger les fichiers JAR Looker. Assurez-vous que les deux fichiers JAR sont de la même version. L'utilisation de versions différentes des fichiers JAR principaux et de dépendance peut entraîner une instabilité de votre installation Looker.

  8. Téléchargez le dernier script de démarrage sur le dépôt GitHub looker-open-source. Si vous souhaitez que Looker s'exécute au démarrage du système, vous pouvez télécharger le script looker_init et utiliser les options de script systemd et init.

  9. Déplacez le script de démarrage (nommé looker) et les fichiers JAR Looker (nommés looker-x.x.x.jar et looker-dependencies-x.x.x.jar, où x.x.x est le numéro de version) vers le nouveau répertoire ~/looker.

  10. Renommez looker-x.x.x.jar en looker.jar et looker-dependencies-x.x.x.jar en looker-dependencies.jar.

  11. Le script de démarrage détermine automatiquement la quantité de mémoire Java à allouer à Looker. Si vous souhaitez personnaliser cette valeur manuellement, consultez la page de documentation Paramètres de mémoire Java recommandés pour en savoir plus.

  12. Rendez le script de démarrage Looker exécutable (définissez les autorisations sur 0750).

    chmod 0750 looker
    
  13. Démarrez le processus Looker à partir du shell en tant qu'utilisateur looker.

    ./looker start
    
  14. Pour obtenir de l'aide sur les options de démarrage, utilisez :

    java -jar looker.jar --help
    

    Pour obtenir de l'aide sur les commandes de démarrage, utilisez :

    java -jar looker.jar help
    
  15. Ouvrez un navigateur et accédez à https://hostname:9999, où hostname correspond au nom DNS de l'hôte exécutant Looker.

    Vous devez utiliser https dans l'URL, ce qui générera un avertissement de sécurité que vous devrez ignorer. Cet avertissement restera affiché jusqu'à ce qu'un certificat SSL valide soit installé sur le serveur.

  16. Saisissez la clé de licence fournie par votre analyste Looker.

  17. Saisissez un nom, une adresse e-mail et un mot de passe pour créer votre premier compte.

Créer un enregistrement DNS

Ajoutez un enregistrement DNS looker.[yourdomain].com pour le serveur. Cette étape est facultative, mais recommandée.

Déployer Looker automatiquement

Looker peut être déployé à l'aide d'un outil de gestion de la configuration tel qu'Ansible ou Chef. Un exemple de rôle Ansible pour le déploiement automatisé est disponible sur la page de documentation Outils de gestion de la configuration.

Réglage de l'hyperviseur

Looker s'exécute en tant que machine virtuelle Java. Si votre instance Looker se trouve sur un invité VMware, vous devrez peut-être ajuster les performances. Consultez le guide des bonnes pratiques Java de VMware.

Sur d'autres plates-formes de virtualisation, il peut être utile de réserver la mémoire de l'hôte Looker à partir de l'hyperviseur pour améliorer les performances. Vous ne pouvez pas contrôler cela sur Amazon EC2. Toutefois, pour les autres fournisseurs, consultez leur documentation pour en savoir plus.

Configurer une base de données backend MySQL facultative

Par défaut, Looker utilise une base de données en mémoire HyperSQL pour stocker sa configuration, ses utilisateurs et d'autres données. Toutefois, vous pouvez utiliser une base de données MySQL externe pour stocker les informations internes de Looker. Consultez la page de documentation Migrer vers MySQL pour savoir comment configurer et ajuster une base de données backend MySQL.

Étapes suivantes

Une fois Looker installé, vous pouvez configurer les options de démarrage de Looker.