IBM Cloud Docs
Surveillance d'un serveur bare metal Linux

Surveillance d'un serveur bare metal Linux

Vous pouvez surveiller un serveur bare metal avec IBM Cloud Monitoring en configurant un agent de surveillance sur celui-ci. L'agent de surveillance utilise une clé d'accès (jeton) pour s'authentifier auprès de l'instance IBM Cloud Monitoring. Il fait office de collecteur de données. Il collecte automatiquement les métriques. Vous pouvez afficher des métriques via l'interface utilisateur Web. Vous pouvez surveiller Bare Metal dans IBM Cloud, sur site et dans d'autres clouds.

Par défaut, cet agent collecte l'infrastructure de base et les séries temporelles réseau que vous pouvez utiliser pour surveiller l'hôte. Pour la liste des métriques collectées, voir Métriques disponibles pour les environnements non orchestrés.

L'agent Monitoring collecte automatiquement les types de mesure système suivants par hôte :

  • System hosts metrics fournit des informations sur les mesures d'utilisation de l'unité centrale, de la mémoire et du stockage, que vous pouvez utiliser pour analyser les performances et l'utilisation des ressources de tous vos processus.

  • File and File System metrics fournit des informations sur les fichiers et le système de fichiers que vous pouvez utiliser pour analyser les interactions de fichiers qui se produisent dans votre système. Par exemple, vous pouvez trouver des informations sur vos fichiers ouverts, les octets en cours d'utilisation ou le pourcentage d'utilisation d'un système de fichiers donné.

  • Process metrics fournit des informations sur les processus qui s'exécutent sur vos serveurs. Par exemple, vous pouvez utiliser ces mesures pour explorer le nombre de processus ou obtenir des informations sur le client ou le serveur.

  • Network metrics fournit des informations sur le réseau. Ils offrent un aperçu des connexions établies entre vos applications, conteneurs et serveurs. Par exemple, vous pouvez trouver des informations sur les octets envoyés ou reçus, ou sur le nombre de demandes HTTP, de connexions et de temps d'attente. En outre, pour SQL ou MongoDB, l'agent collecte des informations supplémentaires lorsqu'il est configuré en mode dépannage.

Grâce à l'interface utilisateur Monitoring, vous pouvez analyser des données dans l'onglet Assistant, l'onglet Explorer et dans l'onglet Tableau de bord. Les vues de métrique et les tableaux de bord vous permettent de surveiller les données.

Tenez compte des informations suivantes lors de la surveillance de vos données :

  • Dans l'onglet Explorateur, vous pouvez surveiller des mesures individuelles.

  • Dans l'onglet Conseiller, vous pouvez surveiller les mesures au niveau de Red Hat OpenShift ou de l'hôte.

    Cet onglet n'est disponible que pour les utilisateurs qui appartiennent à une équipe ayant accès à la surveillance de Red Hat OpenShift ou des métriques au niveau de l'hôte.

  • Dans l'onglet Tableau de bord, vous pouvez surveiller les tableaux de bord prédéfinis ou personnalisés et obtenir un aperçu spécialisé des données réseau, des données d'application, de la topologie, des services, des hôtes et des conteneurs. Un panneau affiche une métrique ou un groupe de métriques dans un tableau de bord.

Pour chaque vue de métrique et tableau de bord, vous pouvez définir la portée des données, le mode d'agrégation des données, ainsi que les filtres temporels et de groupe à appliquer aux données. Pour plus d'informations, voir Gestion des panneaux.

Vous pouvez configurer un tableau de bord comme point d'entrée par défaut pour une équipe, unifier l'expérience d'une équipe et permettre aux utilisateurs de concentrer leur attention immédiate sur les informations les plus pertinentes pour eux.

Pour plus d'informations, voir Affichage des métriques.

Avant de commencer

  1. Documentez-vous sur IBM Cloud Monitoring.

  2. Installez l'interface de ligne de commande IBM Cloud. Pour plus d'informations, voir Installation de l'interface de ligne de commande IBM Cloud.

  3. Mettez à disposition une instance IBM Cloud Monitoring à partir du catalogue.

  4. Mettez à disposition un serveur bare metal.

    Pour effectuer les étapes de cette rubrique, vérifiez que vous disposez d'un accès Internet sur le serveur bare metal. Cette vérification est nécessaire pour configurer l'agent de surveillance.

  5. Configurez une connexion VPN entre votre terminal et le serveur bare metal

    L'utilisation du réseau privé virtuel (VPN) permet aux utilisateurs de gérer à distance tous les serveurs en toute sécurité via le réseau privé d'IBM Cloud®. Une connexion VPN depuis votre emplacement vers le réseau privé permet la gestion externe et la récupération des serveurs via un tunnel VPN chiffré. Les tunnels VPN peuvent être lancés vers n'importe quel centre de données IBM Cloud ou PoP vous permettant une redondance géographique.

    Procédez comme suit pour configurer une connexion VPN entre votre terminal et le serveur bare metal :

    1. Activez l'accès VPN sur chaque compte qui nécessite un accès VPN.

    2. En fonction de votre système d'exploitation, téléchargez les derniers fichiers MotionPro 32 bits ou 64 bits à partir du site de téléchargement Array Networks Clients and Tools. En savoir plus.

    3. Configurez un client VPN SSL autonome et ouvrez une connexion :

    Par exemple, si vous utilisez le client MotionPro Plus pour MacOS, pour ajouter un profil, cliquez sur Add.

    Dans la section Basic, entrez un Title. Entrez une Gateway, par exemple, pour un serveur bare metal dans Dallas 10, entrez vpn.dal10.softlayer.com. Entrez votre nom d'utilisateur VPN. Vérifiez que le Port est défini sur 443. Ensuite, cliquez sur OK.

    Pour ouvrir une connexion sécurisée, cliquez sur Login.

  6. Connectez-vous à un serveur bare metal à l'aide de SSH

    Vous pouvez avoir besoin d'un réseau privé virtuel pour accéder à votre système en fonction de votre configuration de sécurité et de la configuration de ssh sur l'hôte bare metal.

    Vous devez accéder à l'hôte via ssh à l'aide de vos données d'identification ou des données d'identification root disponibles à partir de la console IBM Cloud.

    Vous devez disposer des droits d'accès root pour installer l'agent de surveillance.

    Par exemple, vous pouvez effectuer les étapes suivantes pour obtenir les informations bare metal dont vous avez besoin pour la connexion ssh au serveur :

    1. Connectez-vous à votre compte IBM Cloud.

    2. Cliquez sur l'Icône de Menu Icône de menu > Infrastructure classique > Liste d'unités.

    3. Identifiez le serveur bare metal que vous souhaitez surveiller. Copiez l'adresse IP publique.

    4. Cliquez sur le nom de l'unité de serveur bare metal.

    5. Sélectionnez Mots de passe. Copiez le mot de passe de l'utilisateur root.

      Ensuite, à partir d'un terminal, exécutez la commande suivante :

      ssh <USER_ID>@<IP_ADDRESS>
      

      Où :

      <USER_ID> est l'ID utilisateur que vous utilisez pour vous connecter au serveur bare metal. Par exemple, utilisez root.

      <IP_ADDRESS> est l'adresse IP publique du serveur bare metal.

      Par exemple :ssh root@45.123.122.12

Configuration d'un agent de surveillance pour collecter des mesures à partir du serveur bare metal

Vous devez installer un agent de surveillance pour collecter et transférer des métriques d'un serveur bare metal vers une instance IBM Cloud Monitoring.

Pour installer un agent de surveillance à partir de l'interface de ligne de commande, procédez comme suit :

  1. Obtenez la clé d'accès. Pour plus d'informations, voir Obtention de la clé d'accès via l'interface utilisateur IBM Cloud.

  2. Obtenez l'URL d'ingestion. Pour plus d'informations, voir Noeuds finaux du collecteur.

  3. Déployez l'agent de surveillance. Exécutez la commande suivante :

    curl -sL https://ibm.biz/install-sysdig-agent | sudo bash -s -- --access_key ACCESS_KEY --collector COLLECTOR_ENDPOINT --collector_port 6443 --secure true --tags TAG_DATA --additional_conf 'sysdig_capture_enabled: false'
    

    • ACCESS_KEY est la clé d'ingestion de l'instance.

    • COLLECTOR_ENDPOINT est l'URL d'ingestion pour la région où se trouve l'instance de surveillance.

    • TAG_DATA sont des étiquettes séparées par une virgule qui se présentent sous la forme TAG_NAME:TAG_VALUE. Vous pouvez associer une ou plusieurs étiquettes à votre agent de surveillance. Par exemple, role:serviceX,location:us-south. Vous pouvez utiliser ces étiquettes ultérieurement pour identifier les métriques provenant de l'environnement où l'agent s'exécute.

    • L'indicateur SECURE doit être défini sur true pour utiliser une connexion SSL/TLS sécurisée afin d'envoyer des métriques au collecteur.

    • Définissez sysdig_capture_enabled sur false pour désactiver la fonction de capture. La valeur par défaut est true. Pour plus d'informations, voir Utilisation des captures.

    Si cURL n'est pas disponible, vous devez l'installer. Par exemple, pour un serveur bare metal Ubuntu, exécutez la commande suivante : sudo apt-get update. Ensuite, exécutez la commande d'installation : sudo apt-get install curl.

    Consultez l'exemple de commande suivant pour installer un agent de surveillance qui achemine les métriques vers une instance de surveillance dans la région US South (Dallas) :

    curl -sL https://ibm.biz/install-sysdig-agent | sudo bash -s -- -a xxxxxxxxxxxxx -c ingest.us-south.monitoring.cloud.ibm.com --collector_port 6443 --secure true -ac "sysdig_capture_enabled: false" --tags sourceType:baremetal,location:dallas
    
  4. Configurez l'agent pour les environnements non orchestrés.

    Ouvrez le fichier dragent.yaml qui se trouve dans /opt/draios/etc/.

    Ajouter le paramètre de configuration suivant :

    feature:
      mode: monitor_light
    

    Redémarrez l'agent. Exécutez la commande suivante :

    service dragent restart
    

Lancez l'interface utilisateur de surveillance pour vérifier que vous obtenez des données pour surveiller le serveur bare metal

Pour lancer l'interface utilisateur Web, procédez comme suit :

  1. Connectez-vous à votre compte IBM Cloud.

    Une fois que vous êtes connecté avec votre ID utilisateur et votre mot de passe, la console IBM Cloud s'ouvre.

  2. Cliquez sur l'icône de MenuIcône de menu > Observabilité.

  3. Sélectionnez Surveillance.

    La liste des instances disponibles sur IBM Cloud s'affiche.

  4. Sélectionnez votre instance. Cliquez ensuite sur Ouvrir le tableau de bord.

Un certain délai peut s'écouler avant que l'entrée bare metal soit visible tandis que les informations sont initialement collectées et traitées par l'agent de surveillance.

Vous ne pouvez surveiller qu'une seule instance par navigateur. Vous pouvez avoir plusieurs onglets pour la même instance.

Surveillez votre bare metal

Dans l'onglet Conseiller, vous pouvez surveiller et dépanner l'intégrité , le risque et la capacité des hôtes et des clusters Kubernetes.

Onglet Assistant
Onglet Assistant

  • Les données sont actualisées toutes les 10 minutes.
  • Les indicateurs sont classés par ordre de priorité par nombre d'événements et gravité.
  • Pour plus d'informations, voir Advisor.

Dans la section Advisor, choisissez de surveiller par hôte. Consultez les tableaux de bord prédéfinis que vous pouvez utiliser pour surveiller la santé de vos ressources.

Lorsque vous choisissez de surveiller par hôte, vous pouvez choisir l'un des tableaux de bord suivants :

  • Utilisation de la ressource hôte
  • Utilisation et performances du système de fichiers
  • Utilisation de la mémoire
  • Réseau
  • Statut de & l'intégrité de l'agent Sysdig

[Facultatif] Configuration de l'exportateur IPMI Prometheus pour surveiller les mesures du détecteur

En plus de l'ensemble des métriques qui sont collectées automatiquement par l'agent de surveillance, vous pouvez collecter d'autres métriques telles que les métriques de capteur. Vous pouvez utiliser Prometheus IPMI Exporter pour collecter les métriques de capteur d'unité IPMI (Intelligent Platform Management Interface) à partir du serveur bare metal.

  • L'exportateur Prometheus IPMI Exporter prend en charge les unités IPMI locales et les unités distantes auxquelles vous pouvez accéder en utilisant le protocole RMCP (Remote Management Control Protocol).
  • Lorsque vous utilisez RMCP pour accéder aux unités distantes, vous pouvez utiliser un exportateur IPMI pour surveiller plusieurs unités IPMI. Vous identifiez chaque unité en transmettant le nom d'hôte cible en tant que paramètre.
  • L'exportateur IPMI s'appuie sur les outils de la suite FreeIPMI.

Vous pouvez collecter les métriques suivantes lorsque vous configurez l'exportateur IPMI dans un serveur bare metal :

  • Métriques d'administration IPMI

    L'indicateur ipmi_up {collector="<NAME>"} signale 1 lorsque les données d'un hôte distant sont collectées avec succès. Elle indique 0 pour la collecte de données dans un hôte local.

    La métrique ipmi_scrape_duration_seconds indique la durée nécessaire au collecteur pour extraire les données.

  • Métriques de journal des événements du système IPMI (SEL)

    La métrique ipmi_sel_entries_count indique le nombre d'entrées dans le journal des événements du système.

    La métrique ipmi_sel_free_space_bytes indique le nombre d'octets disponibles pour les entrées de journal des événements de système.

  • Données du capteur IPMI

    L'exportateur IPMI collecte 2 métriques par type de capteur : état et valeur. La valeur 0 signale un état normal. La valeur 1 signale un état d'avertissement. La valeur 2 signale un état critique. La valeur des informations de rapports NaN n'est pas disponible. Par exemple, consultez les métriques pour les différents capteurs :

    Métriques de capteur de température : ipmi_temperature_celsius, ipmi_temperature_state

    Métriques de capteur de vitesse de ventilateur : ipmi_fan_speed_rpm, ipmi_fan_speed_state

    Métriques de capteur de tension : ipmi_voltage_state, ipmi_voltage_volts

  • Etat d'alimentation du châssis IPMI de la machine

    La métrique ipmi_chassis_power_state indique l'état en cours du châssis de la machine. Sa valeur est 1 lorsque le châssis est sous tension. Sa valeur est 0 lorsque le châssis est hors tension.

  • Données DCMI

    La métrique ipmi_dcmi_power_consumption_current_watts indique la consommation d'énergie réelle de la machine en watts.

  • Détails de BMC

    La métrique ipmi_bmc_info indique les informations sur la révision et le fabricant du microprogramme sur des étiquettes et a la valeur 1.

Pour plus d'informations, voir Prometheus IPMI Exporter.

Procédez comme suit pour configurer Prometheus IPMI Exporter :

Installer l'exportateur Prometheus IPMI

Procédez comme suit :

  1. A partir d'un terminal local, téléchargez l'exportateur IPMI Prometheus.

  2. Dans le serveur bare metal, à partir de la session shh, créez le répertoire /usr/monitor. Exécutez les commandes suivantes :

    cd /usr
    
    mkdir monitor
    
  3. Copiez le fichier sur le serveur bare metal. Dans le répertoire où le fichier est disponible, exécutez la commande suivante :

    scp ipmi_exporter-v1.2.0.linux-amd64.tar.gz  root@<IP_ADDRESS>:/usr/monitor/
    

    <IP_ADDRESS> est l'adresse IP publique du serveur bare metal.

    Si la commande échoue, vérifiez que votre connexion VPN est toujours ouverte.

  4. Dans le serveur bare metal, à partir de la session shh, décompressez le fichier. Exécutez les commandes suivantes :

    cd /usr/monitor/
    
    tar -xvf ipmi_exporter-v1.2.0.linux-amd64.tar.gz
    
  5. Dans le serveur bare metal, à partir de la session shh, installez la suite FreeIPMI. Exécutez les commandes suivantes :

    sudo apt-get update
    
    sudo apt-get install freeipmi
    
  6. Dans le serveur bare metal, à partir de la session shh, vérifiez le fichier ipmi_local.yml. Vous pouvez éventuellement mettre à jour le fichier afin d'exclure les capteurs que vous ne souhaitez pas surveiller.

    Accédez au répertoire dont vous avez extrait l'exportateur IPMI :

    cd ipmi_exporter-v1.2.0.linux-amd64/
    

    Vérifiez le fichier de configuration. Exécutez la commande : more ipmi_local.yml Vous devez voir un fichier avec un contenu similaire.

    # Configuration file for ipmi_exporter
    
    # This is an example config for scraping the local host.
    # In most cases, this should work without using a config file at all.
    modules:
            default:
                    # Available collectors are bmc, ipmi, chassis, dcmi, and sel
                    collectors:
                    - bmc
                    - ipmi
                    - dcmi
                    - chassis
                    - sel
                    # Got any sensors you don't care about? Add them here.
                    exclude_sensor_ids:
                    # - 2
    
  7. Dans le serveur bare metal, à partir de la session shh, exécutez l'exportateur IPMI.

    ./ipmi_exporter --config.file=ipmi_local.yml &
    
  8. Vérifiez que l'exportateur IPMI est en cours d'exécution. Exécutez la commande suivante :

    ps -aux | grep ipmi
    

    Vous devriez voir l'exportateur IPMI s'exécuter.

Installer l'exportateur Prometheus

L'agent de surveillance collecte automatiquement des métriques auprès des exportateurs Prometheus. Par conséquent, pour collecter des métriques sur votre exportateur IPMI, vous devez également configurer l'exportateur Prometheus.

Pour exécuter l'exportateur Prometheus, procédez comme suit :

  1. A partir d'un terminal local , téléchargez l'exportateur Prometheus.

  2. Dans le serveur bare metal, à partir de la session shh, accédez au répertoire /usr/monitor/. Exécutez la commande suivante :

    cd /usr/monitor/
    
  3. Copiez le fichier sur le serveur bare metal. Dans le répertoire où le fichier est disponible, exécutez la commande suivante :

    scp prometheus-2.18.1.linux-amd64.tar.gz root@<IP_ADDRESS>:/usr/monitor/
    

    <IP_ADDRESS> est l'adresse IP publique du serveur bare metal.

    Si la commande échoue, vérifiez que votre connexion VPN est toujours ouverte.

  4. Dans le serveur bare metal, à partir de la session shh, décompressez le fichier. Exécutez les commandes suivantes :

    cd /usr/monitor/
    
    tar -xvf prometheus-2.18.1.linux-amd64.tar.gz
    
  5. Modifiez le fichier prometheus.yml pour inclure des informations sur la configuration scrape_configuration pour l'exportateur IPMI.

    Accédez au répertoire Prometheus :

    cd prometheus-2.18.1.linux-amd64/
    

    Editez le fichier prometheus.yml et ajoutez la section scrape_configs :

    # my global config
    global:
      scrape_interval:     15s # Set the scrape interval to every 15 seconds. Default is every 1 minute.
      evaluation_interval: 15s # Evaluate rules every 15 seconds. The default is every 1 minute.
      # scrape_timeout is set to the global default (10s).
    
    # Alertmanager configuration
    alerting:
      alertmanagers:
      - static_configs:
        - targets:
          # - alertmanager:9093
    
    # Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
    rule_files:
      # - "first_rules.yml"
      # - "second_rules.yml"
    
    # A scrape configuration containing exactly one endpoint to scrape:
    # Here it's Prometheus itself.
    scrape_configs:
      # The job name is added as a label `job=<job_name>` to any timeseries scraped from this config.
      - job_name: ipmi
    
        metrics_path: '/metrics'
        scheme: http
    
        static_configs:
        - targets: ['localhost:9290']
          labels:
            instance: baremetal01
            region: us-south
    
  6. Exécutez l'exportateur Prometheus :

    ./prometheus &
    

Configurer les paramètres réseau

Si vous souhaitez collecter des métriques à partir de serveurs distants, procédez comme suit :

  1. Activez le pare-feu pour autoriser l'accès à ipmi_exporter.

  2. [Facultatif] Mettre à jour les règles VPC

    Si vous utilisez des noeuds finaux privés, ajoutez une règle entrante au groupe de sécurité pour le port 9290 avec source type = Security Group et choisissez le groupe de sécurité pour le serveur bare metal.

Mettre à jour l'agent de surveillance qui s'exécute sur le serveur bare metal

Procédez comme suit :

  1. Dans le serveur bare metal, à partir de la session shh, accédez au répertoire /opt/draios/etc/. Exécutez la commande suivante :

    cd /opt/draios/etc/
    
  2. Mettez à jour le fichier /opt/draios/etc/dragent.yaml.

    Ajoutez la section suivante à la fin du fichier dragent.yaml :

    prometheus:
     enabled: true
     interval: 30
     log_errors: true
     max_metrics: 3000
     max_metrics_per_process: 3000
     max_tags_per_metric: 20
     process_filter:
       - include:
           port: 9090
           conf:
             port: 9090
             path: "/metrics"
       - include:
           port: 9290
           conf:
             port: 9290
             path: "/metrics"
    
  3. Redémarrez l'agent de surveillance. Exécutez la commande suivante :

    service dragent restart
    

Vérifiez que vous pouvez voir les mesures prometheus ipmi

Procédez comme suit :

  1. Cliquez sur l'icône de MenuIcône de menu > Observabilité.

  2. Sélectionnez Surveillance.

  3. Identifiez l'instance de surveillance que vous avez créée. Cliquez ensuite sur Ouvrir le tableau de bord.

  4. Dans la vue Explore, sélectionnez Hosts and Containers. Ensuite, sélectionnez le serveur bare metal que vous souhaitez surveiller.

    Vue Hôtes et conteneurs
    Vue Hôtes et conteneurs

  5. Ouvrez l'option pour sélectionner plus de tableaux de bord et de métriques. Entrez ensuite ipmi dans la barre de recherche. La liste des métriques IPMI s'affiche.

    Métriques IPMI
    Métriques IPMI

Configurez un tableau de bord pour analyser le statut IPMI de votre bare metal

Pour créer un tableau de bord afin de surveiller les métriques IPMI, procédez comme suit :

  1. Sélectionnez la métrique ipmi_up.

    ipmi_up metrics
    ipmi_up metrics

  2. Sélectionnez l'icône de points de suspension. Sélectionnez ensuite Copy to dashboard.

    Copier le tableau de bord
    Copier le tableau de bord

  3. Entrez le nom Surveillance IPMI [Bare Metal]. Sélectionnez ensuite Copy and Open.

    Copier et ouvrir un tableau de bord
    Copier et ouvrir un tableau de bord

    Le tableau de bord s'ouvre.

    Tableau de bord personnalisé IPMI
    Tableau de bord personnalisé IPMI

  4. Ajoutez d'autres mesures IPMI au tableau de bord personnalisé de Surveillance IPMI [Bare Metal]. Répétez les étapes pour chacune des métriques IPMI que vous souhaitez surveiller.

  5. Faites glisser et déposez et redimensionnez les panneaux pour obtenir la disposition de tableau de bord souhaitée. Sauvegardez la présentation.

Etapes suivantes