Traitement des incidents
Passez en revue les informations suivantes pour résoudre les problèmes liés à votre instance d' VMware Cloud Foundation for Classic - Automated. Vos administrateurs système doivent identifier les symptômes du problème, déterminer quels composants de la solution sont affectés, rechercher et proposer un correctif ou une solution de contournement, et tester le correctif.
- Identification des symptômes. Un certain nombre de causes potentielles peuvent entraîner des performances insuffisantes ou l'absence de performances de votre instance. La première étape d'un dépannage efficace consiste à identifier exactement ce qui ne va pas. Ces symptômes peuvent être signalés par des événements et des alarmes VMware vSphere®, la gestion des opérations dans IBM Cloud® ou depuis votre centre de services par l'un de vos utilisateurs.
- Isolation des composants affectés. Après avoir identifié les symptômes du problème, vous devez identifier les composants logiciels ou matériels qui sont affectés. Déterminez s'ils sont à l'origine du problème et identifiez ceux qui ne sont pas impliqués. Des outils tels que vCenter Operations Management dans IBM Cloud vous assistent dans cette étape.
- Proposition d'un correctif ou d'une solution de contournement. Une fois que vous avez compris les symptômes et isolé les composants, vous pouvez rechercher les correctifs et les solutions de contournement possibles. Vos administrateurs système utilisent également le portail IBM Cloud, y compris les scénarios de dépannage de ce document ainsi que IBM ServiceNow et la base de connaissances VMware. De plus, vous trouverez de nombreux wikis et blogues qui pourront vous aider. Pour des résolutions encore plus rapides, la gestion des opérations dans IBM Cloud inclut un certain nombre de mesures correctives pour les problèmes identifiés.
- Test des solutions possibles. Une fois que vous connaissez les symptômes et les composants impliqués et que vous disposez d'un correctif ou d'une solution de contournement, vos administrateurs système testent systématiquement les solutions jusqu'à ce que le problème soit résolu.
vSphere comprend un sous-système d'événements et d'alarmes configurables par l'utilisateur qui suit les événements qui se produisent dans l'environnement vSphere et stocke les données dans des fichiers journaux et dans la base de données vCenter. Ce sous-système permet également aux administrateurs système de spécifier les conditions dans lesquelles les alarmes sont déclenchées. Les alarmes changent d'état, passant d'avertissements à des alertes plus graves au fur et à mesure que l'état du système change, et peuvent déclencher des actions d'alarme automatisées telles que l'envoi d'un courrier électronique à l'équipe d'administrateurs système. Cette fonction est utile si vous souhaitez être informé ou prendre des mesures immédiates lorsque certains événements ou certaines conditions surviennent pour un objet d'inventaire ou un groupe d'objets spécifique.
Des outils supplémentaires tels que ceux incorporés dans la gestion des opérations sur l'architecture IBM Cloud vous offrent en outre une aide complémentaire pour identifier les symptômes, isoler les composants affectés et proposer une correction ou une solution de contournement.
Instructions
Les instructions suivantes sont considérées comme des pratiques recommandées pour l'identification et la résolution des incidents liés à votre problème IBM Cloud for VMware Solutions.
- Abordez le dépannage et la résolution de problèmes de façon systématique.
- Les symptômes sont-ils liés à la disponibilité, à l'utilisation ou à la configuration ?
- Disponibilité - Ces symptômes sont liés à la disponibilité des composants matériels et logiciels et se caractérisent par une absence de réponse. Souvent, la conception haute disponibilité (HA) masque ces problèmes afin qu'ils n'aient pas d'impact direct sur vos charges de travail et vos utilisateurs.
- Utilisation - Ces symptômes sont liés à la capacité et aux performances et se caractérisent par un fonctionnement lent ou une incapacité de chargement. Une gestion proactive de la capacité réduit considérablement ces problèmes.
- Configuration - Ces problèmes sont généralement découverts lors de la mise en place de nouveaux services ou à la suite de l'application d'une modification. Des réglages incorrects peuvent apparaître comme des symptômes de disponibilité ou d'utilisation. Par exemple, une adresse IP incorrecte est considérée comme un problème de disponibilité, alors que si les paramètres de mémoire RAM de la machine virtuelle sont trop bas, des symptômes d'utilisation apparaissent.
- Essayez de rattacher le problème à un composant de l'environnement.
- Prenez des notes afin de pouvoir suivre vos démarches.
- Localisez et documentez vos versions de logiciels.
- Documentez votre sous-réseau et l'utilisation de votre adresse IP, y compris les adresses VIP et NAT.
- Obtenez des diagrammes de votre réseau. Vous avez besoin d'un certain nombre de diagrammes qui montrent la couche physique (sous-couche) et la couche logique (surcouche).
- Prenez connaissance de tout changement récent dans l'environnement.
- Étudiez l'impact de la correction; ne vous excluez pas des interfaces de gestion.
- Assurez-vous d'avoir des sauvegardes de tous les composants clés, au cas où ils auraient besoin d'être rechargés ou réinitialisés.
- Ne changez pas plus d'une chose à la fois.
- Documentez chaque changement et son résultat.
- Lorsque vous ouvrez une demande de support, assurez-vous de bien la documenter et de fournir des informations pertinentes. Soyez clair dans les symptômes que vous voyez et identifiez les composants que vous croyez défectueux. Assurez-vous d'utiliser la bonne terminologie. Essayez de minimiser toute confusion ou ambiguïté dans votre choix de mots.
- vSphere Les fichiers de configuration ESXi et VMware vCenter® contrôlent le comportement du système. La plupart des paramètres du fichier de configuration sont définis pendant l'installation, mais peuvent être modifiés après l'installation.
- Les fichiers journaux capturent les messages générés par le noyau et les différents sous-systèmes et services. Les services vSphere ESXi et vCenter conservent des fichiers journaux distincts. Comprenez où ils se trouvent et comment y accéder.
- Comprenez comment utiliser les outils d'administration système les plus répandus pour vous aider dans le diagnostic.
Dépannage avec les fichiers journaux
Les fichiers journaux constituent une excellente source d'informations pour résoudre les problèmes. Cependant, le nombre de fichiers journaux et la grande quantité d'entrées dans chaque journal rendent le diagnostic difficile. Emplacement des fichiers journaux pour les produits d' VMware(1021806) détaille l'emplacement de ces fichiers journaux dans l'environnement d' VMware. En raison du nombre de fichiers journaux et du grand nombre d'entrées dans chaque journal, envisagez d'utiliser les outils disponibles pour la gestion des opérations dans IBM Cloud pour vous aider à capturer des journaux d'événements et à les analyser.
Dépannage des scénarios courants
Afin de mieux isoler les composants affectés, cette documentation sur le dépannage de scénarios courants est classée dans les catégories suivantes :
- Machines virtuelles - ces rubriques de dépannage fournissent des conseils sur les problèmes potentiels pouvant survenir sur les machines virtuelles.
- Hôtes - ces rubriques de dépannage fournissent des conseils sur les problèmes rencontrés sur les hôtes vSphere ESXi.
- Stockage - ces rubriques de dépannage fournissent des conseils permettant de résoudre les problèmes de stockage vSAN et NFS.
- Réseau - ces rubriques de dépannage fournissent des conseils permettant de résoudre les problèmes de réseau.
- vCenter - ces rubriques de dépannage fournissent des conseils permettant de résoudre les problèmes liés à vCenter.
- Licences - ces rubriques de dépannage fournissent des conseils pour résoudre les problèmes de licence, qui sont généralement liés aux clients qui possèdent leurs propres licences pour IBM Cloud.
Titre | Description |
---|---|
Dépannage générique des machines virtuelles | Pour plus d'informations, voir Dépannage des machines virtuelles. |
Problèmes de performances de la machine virtuelle | Vous pouvez identifier et résoudre les symptômes des problèmes de performance des machines virtuelles, comme un démarrage lent du système d'exploitation invité, les mauvaises performances des applications, un démarrage long des applications ou la non-réactivité des applications. |
Récupération des machines virtuelles orphelines | Les machines virtuelles orphelines sont des machines virtuelles qui existent dans la base de données vCenter mais qui ne sont pas reconnues par l'hôte vSphere ESXi. Pour plus d'informations sur la récupération des machines virtuelles orphelines, voir Récupérer des machines virtuelles orphelines. |
La machine virtuelle ne s'allume pas | Pour plus d'informations, voir Dépannage d'une machine virtuelle qui ne s'allume pas(2001005 ). |
La machine virtuelle ne s'allume pas après le clonage ou le déploiement à partir d'un modèle | Le déploiement des machines virtuelles examine les problèmes qui affectent une MV après qu'elle a été clonée ou déployée à partir d'un modèle. |
Dispositifs réseau de machines virtuelles anciens | Pour les périphériques réseau de machines virtuelles qui ne sont pas à jour, les performances du réseau et celles des applications peuvent être affectées. Pour plus d'informations sur le déploiement d'un nouveau périphérique réseau virtuel et d'un nouveau pilote, consultez Choisir une carte réseau pour votre machine virtuelle(1001805 ). |
Limite de mémoire de la machine virtuelle | Les limites de mémoire sont souvent utilisées. Cependant, si un système d'exploitation invité ne peut pas accéder à la mémoire dont il a besoin, les applications qu'il héberge peuvent présenter de mauvaises performances. Pour plus d'informations sur la résolution du problème, voir Configuration des paramètres d'allocation des ressources. |
Instantanés de machines virtuelles | Bien que les instantanés soient utiles, la quantité et l'âge des instantanés d'une machine virtuelle ont un impact direct sur la performance de la machine virtuelle. Pour plus d'informations sur la résolution du problème, voir Consolider les instantanés. |
Journalisation des machines virtuelles | Si la journalisation n'est pas configurée correctement, la capacité du magasin de données peut être affectée de manière négative. Pour plus d'informations sur la résolution du problème, voir Configuration des niveaux de journalisation pour le système d'exploitation invité. |
Dépannage des problèmes de connexion réseau | Les symptômes peuvent inclure l'échec de la connexion de la machine virtuelle au réseau ou l'absence de connectivité réseau vers ou depuis une machine virtuelle donnée. Pour plus d'informations sur la résolution du problème, consultez Dépannage des problèmes de connexion réseau des machines virtuelles(1003893 ). |
Déterminer si plusieurs unités centrales virtuelles causent des problèmes de performance | Ces problèmes peuvent inclure des vitesses de transfert médiocres lors de la copie de données vers ou à partir d'une machine virtuelle, le dépassement du délai de sauvegarde ou des tâches très lentes, ou des performances insuffisantes d'une machine virtuelle. |
Une machine virtuelle a été mise hors tension ou redémarrée | Pour plus d'informations, consultez Déterminer pourquoi une machine virtuelle a été mise hors tension ou redémarrée(1019064 ). |
Une ou plusieurs de vos machines virtuelles ont un temps de réponse faible | Les problèmes de performance peuvent être causés par des contraintes de l'unité centrale, une surcharge mémoire, une latence du stockage ou une latence du réseau. |
Titre | Description |
---|---|
Commandes ESXI | VMware® vSphere Pour obtenir une vue d'ensemble des interfaces de ligne de commande dans l' vSphere, ez les commandes ESXi Shell et les commandes de l'interface de ligne de commande d' vCLI, consultez la page Getting started with vSphere command-line interfaces. |
Etats de la haute disponibilité de l'hôte vSphere | Si vCenter signale un état d'hôte vSphere HA qui indique une condition d'erreur sur l'hôte, il convient de résoudre les problèmes. Ceux-ci peuvent empêcher vSphere HA de redémarrer les machines virtuelles après une panne. Pour plus d'informations, voir Dépannage des états d'hôte vSphere HA. |
vSphere L'hôte ESXi est dans un état de non-réponse | Un état de non-réponse inclut Not Responding , Disconnected , ou les VM sur l'hôte s'affichent comme Unavailable dans vCenter. Pour plus d'informations sur le dépannage d'un hôte ESXi d' vSphere, qui
ne répond pas, consultez la section Les hôtes ESX/ESXi ne répondent pas et sont grisés(1019082 ). |
Lorsque vous mettez sous tension une machine virtuelle, l'erreur File not found s'affiche |
Pour plus d'informations, consultez le Portail d'assistance de Broadcom. |
Problèmes de performances de la machine virtuelle | Les problèmes de performance peuvent être causés par des contraintes de l'unité centrale, une surcharge mémoire, une latence du stockage ou une latence du réseau. |
Le serveur bare metal ne fonctionne pas | Si le serveur bare metal qui exécute vSphere ESXi ne répond pas ou n'est pas en cours d'exécution, connectez-vous à l'interface utilisateur ou à la console de gestion d'IBM Cloud et vérifiez son statut. Si nécessaire, ouvrez un cas pour obtenir de l'aide avec votre serveur bare metal. Pour plus d'informations, voir Gestion des cas de support. |
L'hôte vSphere ESXi est déconnecté ou ne répond pas | Pour plus d'informations, consultez Dépannage d'un hôte ESXi/ESX dans un état de non-réponse(1003409 ). |
Ecran de diagnostic Purple | Les erreurs d'écran Purple peuvent signaler une panique du noyau. L' vmkernel e du noyau ESXi d' vSphere déclenche cette mesure de sécurité en réponse à un événement ou une erreur irrécupérable. En cas d'erreur irrécupérable,
la poursuite de l'exécution présente un risque élevé pour les services et les machines virtuelles. En cas de panique et de panne des hôtes vSphere ESXi, le noyau arrête tous les services en cours d'exécution ainsi que toutes les machines
virtuelles hébergées. Les machines virtuelles ne sont pas éteintes en douceur, mais mises hors tension de façon subite. Si l'hôte fait partie d'un cluster et que vous avez configuré la haute disponibilité, ces machines virtuelles sont
redémarrées sur les autres hôtes du cluster. Pour plus d'informations, consultez le Portail d'assistance de Broadcom. |
Titre | Description |
---|---|
Dépannage du stockage | Les problèmes peuvent être causés par des performances lentes, des pannes imprévisibles, une corruption de disque ou une corruption de la machine virtuelle. |
Dépannage du réseau de stockage virtuel | Pour plus d'informations, voir la rubrique Gestion des pannes dans vSAN. |
Défaillance du disque du réseau de stockage virtuel | Pour plus d'informations sur la manière d'identifier une panne de disque spécifique dans un cluster de déduplication d' vSAN, voir Identification d'une panne de disque spécifique dans un cluster de déduplication d' vSAN. |
Elimination des problèmes de santé du réseau de stockage virtuel | Des alertes et des avertissements concernant des problèmes liés à l'état de santé du réseau de stockage virtuel peuvent s'afficher sur la page Moniteur du client Web VMware vSphere. Pour plus d'informations sur la résolution de ces problèmes, consultez Alertes et avertissements sur l'état du SAN virtuel. |
Rééquilibrage du réseau de stockage virtuel | Si des disques signalent des erreurs dans le diagnostic d'intégrité indiquant que le cluster est déséquilibré et que certains disques utilisent beaucoup d'espace alors que d'autres non, vous devez procéder à un rééquilibrage proactif. Un rééquilibrage manuel des objets dans un cluster vSAN est initié. Pour plus d'informations sur le rééquilibrage proactif d' vSAN, et savoir quand il peut être appliqué, consultez vSAN proactive rebalance(2149809 ). |
Lancement du test d'intégrité du réseau de stockage virtuel | Si vous soupçonnez un problème lié à vSAN, vous pouvez lancer un test d'intégrité pour vous assurer que les composants du cluster fonctionnent comme prévu. L'exécution du test de création de machine virtuelle crée une machine virtuelle sur chaque hôte du cluster, puis la supprime. Si ces tâches aboutissent, les composants du cluster fonctionnent comme prévu et le cluster est fonctionnel. Ensuite, un test de performance du réseau est utilisé pour détecter et diagnostiquer les problèmes de connectivité et pour s'assurer que la bande passante du réseau entre les hôtes est adéquate. Pour plus d'informations, voir Tests proactifs. |
Surveillance de la performance du réseau de stockage virtuel | Pour plus d'informations, voir Suivi des performances de l' vSAN. Des tableaux de performances sont disponibles pour les clusters, les hôtes, les disques physiques, les machines virtuelles et les disques virtuels. |
Dépannage du réseau de stockage virtuel | Pour plus d'informations, voir Gestion des pannes et dépannage vSAN. |
Titre | Description |
---|---|
La partition /var/log de NSX Edge est proche de la saturation sur le serveur de périphérie actif |
Pour plus d'informations, voir Dépannage des problèmes liés à l'espace disque : NSX pour les nœuds vSphere. |
Test de la bande passante HCX | Si vous soupçonnez un problème de bande passante du réseau lié à HCX, utilisez perftest pour rechercher la bande passante disponible dans les tunnels HCX. Pour plus d'informations, voir Étapes pour exécuter perftest dans HCX(56211 ). Des essais bidirectionnels sont effectués pour chaque test perftest . Pour la paire de passerelles, l'un s'effectue à l'intérieur du centre
de données source (sur site) et l'autre dans IBM Cloud. Pour le test de performance, perftest , l'expéditeur d'essayer d'envoyer aussi vite que le lien le permet. Par conséquent, pour chaque test, vous voyez un taux "expéditeur"
plus élevé que le taux "récepteur". Vous pouvez considérer la valeur du taux "récepteur" comme un résultat de débit unidirectionnel. |
Traitement des incidents liés à HCX | Pour plus d'informations, voir Traitement des alarmes dans HCX. |
Etat de synchronisation avec une progression de 0% et 0 octets avec une erreur de statut | HCX - Bilan de santé et bonnes pratiques. |
Faible performance du réseau de machines virtuelles | Passez en revue les paramètres de la carte réseau virtuelle des machines virtuelles. VMware recommande les cartes réseau virtuelles VMXNET 3 pour les machines virtuelles car il s'agit de la dernière génération de cartes réseau paravirtualisées conçues pour la performance. Vérifiez la compatibilité de VMXNET 3 à l'aide de la liste de compatibilité VMware et, si elle est prise en charge, modifiez la carte réseau virtuelle pour améliorer les performances du réseau. Pour plus d'informations, voir Dépannage de la mise en réseau. |
Titre | Description |
---|---|
Accès à la console de machine virtuelle | Pour plus d'informations, voir Utilisation d'une console de machine virtuelle. |
Le nouveau certificat de vCenter Server ne semble pas se charger | Après le remplacement des certificats par défaut d' vCenter, il se peut que les nouveaux certificats ne semblent pas se charger. Pour plus d'informations, voir Nouveau serveur d' vCenter. Le certificat ne semble pas se charger. |
vCenter Server n'arrive pas à se connecter aux hôtes gérés | Après le remplacement des certificats d' vCenter s par défaut et le redémarrage du système, l'appliance de serveur vCenter® (VCSA) ne peut pas se connecter aux hôtes gérés. VMware Pour plus d'informations, consultez vCenter Le serveur ne peut pas se connecter aux hôtes gérés. |
Impossible de configurer vSphere HA lors de l'utilisation de certificats SSL personnalisés | Après l'installation de certificats SSL personnalisés, les tentatives d'activation de la haute disponibilité ( vSphere ) échouent. Pour plus d'informations, voir Impossible de configurer l' vSphere er HA lorsque vous utilisez des certificats SSL personnalisés. |
Titre | Description |
---|---|
Configuration de licence incompatible ou incorrecte | Pour plus d'informations, voir Dépannage des licences hôte. |
La machine virtuelle ne s'allume pas | Il est possible qu'un problème de licence existe si vous ne pouvez pas mettre sous tension une machine virtuelle sur un hôte vSphere ESXi et que vous recevez le message The 60-day evaluation period of the host is expired or the license of the host is expired .
Pour plus d'informations, voir Impossible de démarrer une machine virtuelle. |
Une fonctionnalité n'est pas disponible ou ne permet pas de modifier une configuration | Pour plus d'informations, voir Impossible de configurer ou d'utiliser une fonctionnalité. |
Liens connexes
- Obtenir de l'aide et de l'assistance
- vSphere aperçu du dépannage
- vSphere dépannage avec les logs
- Gestion des opérations sur IBM Cloud
- Collecte de logs d'assistance
- Surveillance des événements, des alarmes et des actions automatisées
- vSphere Fichiers journaux du système
- Considérations sur la modification des VCF for Classic - Automated artefacts