IBM Cloud Docs
Fehlerbehebung

Fehlerbehebung

Lesen Sie die folgenden Informationen, um Probleme mit Ihrer VMware Cloud Foundation for Classic – Automated-Instanz zu beheben. Ihre Systemadministratoren müssen die Symptome des Problems ermitteln, bestimmen, welche der Lösungskomponenten betroffen sind, Recherchen durchführen und einen Fix oder eine Problemumgehung vorschlagen und den Fix testen.

  • Erkennen von Symptomen. Eine Reihe möglicher Ursachen kann dazu führen, dass Ihre Instanz nicht oder nur unzureichend funktioniert. Der erste Schritt einer effizienten Fehlerbehebung besteht darin, genau zu erkennen, was schief läuft. Diese Symptome können von VMware vSphere ® -Ereignissen und -Alarmen, von Operations Management in IBM Cloud®oder von Ihrem Service-Desk aus einem Ihrer Benutzer berichtet werden.
  • Die betroffenen Komponenten isolieren. Nachdem Sie die Symptome des Problems erkannt haben, müssen Sie die betroffenen Software-oder Hardwarekomponenten identifizieren. Geben Sie an, ob sie das Problem möglicherweise verursachen, und die Komponenten, die nicht beteiligt sind. Tools wie vCenter Operations Management unter IBM Cloud unterstützen Sie bei diesem Schritt.
  • Ein Fix oder eine Problemumgehung wird vorgeschlagen. Nachdem Sie die Symptome verstanden und die Komponenten isoliert haben, können Sie mögliche Fixes und Fehlerumgehungen recherchieren. Ihre Systemadministratoren verwenden dafür auch das IBM Cloud-Portal, einschließlich der Fehlerbehebungsszenarios in diesem Dokument sowie IBM ServiceNow und VMware Knowledge Base. Darüber hinaus finden Sie viele Wikis und Blogs, die helfen könnten. Für noch schnellere Problemlösungen umfasst Operations Management unter IBM Cloud eine Reihe von Lösungen für bereits bekannte Probleme.
  • Testen möglicher Lösungen. Wenn Sie die Symptome kennen, Komponenten involviert und eine Korrektur oder Problemumgehung haben, testen Ihre Systemadministratoren systematisch die Lösungen, bis das Problem gelöst ist.

vSphere enthält ein benutzerkonfigurierbares Ereignis- und Alarm-Subsystem, das Ereignisse in der gesamten vSphere-Umgebung verfolgt und die Daten in Protokolldateien und in der vCenter-Datenbank speichert. Dieses Subsystem ermöglicht es Systemadministratoren auch, die Bedingungen anzugeben, unter denen Alarme ausgelöst werden. Alarme ändern ihren Status von Warnungen zu schwerwiegenderen Alerts, wenn sich die Systembedingungen ändern, und können automatische Alarmaktionen auslösen, z. B. eine E-Mail an das Systemadministratorteam. Diese Funktion ist nützlich, wenn Sie informiert werden möchten oder Sofortmaßnahmen ergreifen möchten, wenn bestimmte Ereignisse oder Bedingungen für ein bestimmtes Inventarobjekt oder eine Gruppe von Objekten auftreten.

Zusätzliche Tools wie die in Operations Management in der IBM Cloud-Architektur enthaltenen Tools stellen weiterführende Unterstützung zum Identifizieren von Symptomen, Isolieren der betroffenen Komponenten und Vorschlagen eines Fix oder einer Ausweichlösung bereit.

Richtlinien

Die folgenden Richtlinien werden als Best Practices für die Fehlerbehebung Ihres IBM Cloud for VMware Solutions-Problems angesehen.

  • Gehen Sie die Fehlerbehebung und Problemlösung systematisch an.
  • Sind die Symptome im Zusammenhang mit; Verfügbarkeit, Verwendung oder Konfiguration:
    • Verfügbarkeit - Diese Symptome beziehen sich auf die Verfügbarkeit von Hardware- und Softwarekomponenten und sind durch das Ausbleiben einer Antwort gekennzeichnet. Oftmals werden diese Probleme durch das Hochverfügbarkeits-Design (HA) verschleiert, sodass sie sich nicht direkt auf Ihre Arbeitslasten und Benutzer auswirken.
    • Verwendung - Diese Symptome beziehen sich auf Kapazität und Leistung und werden durch langsames Laden oder Unfähigkeit des Ladevorgangs typisiert. Eine proaktive Verwaltung von Kapazitäten reduziert diese Probleme erheblich.
    • Konfiguration – Diese Probleme treten in der Regel bei der Bereitstellung neuer Dienste oder als Folge einer Änderung auf. Falsche Einstellungen können als Verfügbarkeit oder als Nutzungssymptome auftreten. Beispielsweise wird eine falsche IP-Adresse als Verfügbarkeitsproblem angezeigt, während die RAM-Einstellungen für virtuelle Maschinen (VM) die Verwendung von Symptomen verursachen.
  • Versuchen Sie, das Problem auf eine Komponente in der Umgebung zu isolieren.
  • Notieren Sie sich Ihre Schritte.
  • Dokumentieren Sie Ihre Softwareversionen.
  • Dokumentieren Sie die Verwendung Ihres Subnetzes und Ihrer IP-Adresse, einschließlich VIP- und NAT-Adressen.
  • Erstellen Sie Diagramme Ihres Netzes. Sie benötigen eine Reihe von Diagrammen, die die physischen (zugrunde liegenden) und die logischen (darüber liegenden) Schichten darstellen.
  • Sehen Sie sich die letzten Änderungen an der Umgebung an.
  • Erforschen Sie die Auswirkungen der Korrektur; schließen Sie sich nicht von Verwaltungsschnittstellen aus.
  • Stellen Sie sicher, dass Sie über Sicherungen aller Schlüsselkomponenten verfügen, falls diese erneut geladen oder zurückgesetzt werden müssen.
  • Nehmen Sie jeweils nur eine Änderung vor.
  • Dokumentieren Sie jede Änderung und ihre Ergebnisse.
  • Wenn Sie eine Support-Anforderung öffnen, muss Ihre Dokumentation vollständig sein und relevante Informationen enthalten. Überprüfen Sie die angezeigten Symptome und ermitteln Sie die Komponenten, von denen Sie vermuten, dass sie fehlerhaft sind. Verwenden Sie die korrekte Terminologie. Versuchen Sie, Ungenauigkeiten oder Mehrdeutigkeiten in Ihren Aussagen zu minimieren.
  • vSphere ESXi und VMware vCenter® Konfigurationsdateien steuern das Verhalten des Systems. Die meisten Konfigurationsdateieinstellungen werden während der Installation festgelegt, können jedoch nach der Installation geändert werden.
  • Protokolldateien erfassen Nachrichten, die vom Kernel und verschiedenen Teilsystemen und Services generiert werden. vSphere ESXi- und vCenter-Services verwalten separate Protokolldateien. Finden Sie heraus, wo sich diese befinden und wie darauf zugegriffen werden kann.
  • Setzen Sie sich damit auseinander, wie gängige Systemverwaltungstools Sie bei der Diagnose unterstützen können.

Fehlerbehebung mit Protokolldateien

Protokolldateien sind eine hervorragende Quelle für Informationen zur Fehlerbehebung. Die Anzahl der Protokolldateien und die große Anzahl an Einträgen in jedem Protokoll machen es jedoch schwer zu diagnostizieren. Speicherort der Protokolldateien für VMware-Produkte(1021806) gibt an, wo sich diese Protokolldateien in der VMware-Umgebung befinden. Aufgrund der Anzahl der Protokolldateien und der großen Anzahl von Einträgen in den einzelnen Protokollen sollten Sie die Tools im Operations Management in IBM Cloud berücksichtigen, um Ereignisprotokolle zu erfassen und zu analysieren.

Gängige Fehlerbehebungsszenarios

In einer Hilfe zur Isolierung der betroffenen Komponenten wird diese Dokumentation zur Fehlerbehebung für allgemeine Szenarien in die folgenden Kategorien eingeteilt.

  • Virtuelle Maschinen - diese Fehlerbehebungskapitel enthalten Anweisungen zu potenziellen Problemen von VMs.
  • Hosts-Fehlerbehebungsthemen, die eine Anleitung für vSphere-ESXi-Hostprobleme bereitstellen.
  • Speicher-Fehlerbehebungsthemen, die eine Anleitung zum Auflösen von vSAN-und NFS-Speicherproblemen bereitstellen.
  • Netz - Fehlerbehebungsthemen, die Anweisungen zum Beheben von Netzproblemen bereitstellen.
  • vCenter-Fehlerbehebungsthemen, die Anleitungen zur Lösung von vCenter-Problemen bereitstellen.
  • Lizenzen-Fehlerbehebungsthemen, die Anleitungen zum Beheben von Lizenzproblemen bereitstellen, die in der Regel mit Clients in Beziehung stehen, die über eigene Lizenzen für IBM Cloudverfügen.
Fehlerbehebung bei virtuellen Maschinen
Titel Beschreibung
Generische VM-Fehlerbehebung Weitere Informationen finden Sie unter "Fehlerbehebung bei virtuellen Maschinen ".
VM-Leistungsprobleme Sie können die Symptome der VM-Leistungsprobleme beheben, einschließlich der langsam beginnenden Gastbetriebssysteme, Anwendungen, die eine schlechte Leistung aufweisen, Anwendungen, die eine lange Zeit in Anspruch nehmen, oder Anwendungen, die nicht mehr reagieren.
Wiederherstellen einer verwaisten VM Verwaiste VMs sind VMs, die in der vCenter-Datenbank vorhanden sind, aber vom vSphere-ESXi-Host nicht erkannt werden. Weitere Informationen zum Wiederherstellen verwaister VMs finden Sie unter Wiederherstellen verwaister virtueller Maschinen.
VM lässt sich nicht einschalten Weitere Informationen finden Sie unter Fehlerbehebung bei einer virtuellen Maschine, die sich nicht einschalten lässt(2001005 ).
VM lässt sich nach dem Klonen oder Bereitstellen aus einer Vorlage nicht einschalten Beim Einsatz virtueller Maschinen werden Probleme untersucht, die eine VM betreffen, nachdem sie geklont oder aus einer Vorlage bereitgestellt wurde.
Alte VM-Netzeinheiten Für VM-Netzeinheiten, die nicht auf dem aktuellen Stand gehalten werden, kann die Netzleistung und die Anwendungsleistung beeinträchtigt werden. Weitere Informationen zur Bereitstellung eines neuen virtuellen Netzwerkgeräts und -treibers finden Sie unter "Auswahl eines Netzwerkadapters für Ihre virtuelle Maschine"(1001805 ).
VM-Speicherbegrenzung Speicherbegrenzungen werden häufig verwendet. Wenn ein Gastbetriebssystem jedoch nicht auf den Speicher zugreifen kann, den es benötigt, können die Anwendungen im Gastbetriebssystem schlecht ausgeführt werden. Weitere Informationen zur Lösung des Problems finden Sie unter "Konfigurieren der Einstellungen für die Ressourcenzuweisung ".
VM-Snapshots Snapshots sind zwar nützlich, aber die Menge und das Alter der Snapshots einer VM wirken sich direkt auf die Leistung der VM aus. Weitere Informationen zur Lösung des Problems finden Sie unter "Snapshots konsolidieren ".
VM-Protokollierung Wenn die Protokollierung nicht ordnungsgemäß konfiguriert ist, kann die Kapazität des Datenspeichers negativ beeinflusst werden. Weitere Informationen zur Lösung des Problems finden Sie unter "Konfigurieren der Protokollierungsstufen für das Gastbetriebssystem ".
Fehlerbehebung bei Netzkonnektivitätsproblemen Symptome können sein, dass die VM keine Verbindung zum Netz herstellen kann oder dass keine Netzkonnektivität mit einer einzelnen VM besteht. Weitere Informationen zur Lösung des Problems finden Sie unter "Fehlerbehebung bei Netzwerkverbindungsproblemen virtueller Maschinen"(1003893 ).
Bestimmen, ob mehrere virtuelle CPUs Leistungsprobleme verursachen Diese Probleme können schlechte Übertragungsgeschwindigkeiten enthalten, wenn sie Daten in eine oder von einer VM kopieren, wenn das Zeitlimit für Sicherungsjobs überschritten wird oder wenn eine VM nur schlecht ausgeführt wird.
Eine VM wurde ausgeschaltet oder erneut gestartet Weitere Informationen finden Sie unter "Ermitteln, warum eine virtuelle Maschine ausgeschaltet oder neu gestartet wurde"(1019064 ).
Mindestens eine virtuelle Maschine weist eine schlechte Antwortzeit auf Leistungsprobleme können durch CPU-Einschränkungen, Speicherüberbelegung, Speicherlatenz oder Netzlatenz verursacht werden.
Typische Fehlerbehebung bei vSphere ESXi-Hosts
Titel Beschreibung
ESXi-Befehle Eine Übersicht über die Befehlszeilenschnittstellen in vSphere,, die ESXi-Shell-Befehle und die Befehle in vCLI ( VMware® vSphere Command-Line Interface) finden Sie unter Erste Schritte mit vSphere-Befehlszeilenschnittstellen.
vSphere HA-Hostzustände Wenn vCenter einen vSphere-HA-Host-Status meldet, der auf eine Fehlerbedingung auf dem Host hinweist, müssen diese Probleme behoben werden. Diese Probleme können verhindern, dass vSphere HA-VMs nach einem Fehler erneut startet. Weitere Informationen finden Sie unter "Fehlerbehebung" vSphere HA-Host-Status.
vSphere ESXi-Host reagiert nicht Ein nicht reagierender Status umfasst Not Responding, Disconnected oder die VMs auf dem Host, die als Unavailable in vCenter angezeigt werden. Weitere Informationen zur Fehlerbehebung bei einem vSphere ESXi-Host, der nicht reagiert, finden Sie unter ESX/ESXi-Hosts reagieren nicht und sind ausgegraut(1019082 ).
Wenn Sie eine virtuelle Maschine mit Strom versorgt haben, wird ein Fehler File not found angezeigt. Weitere Informationen finden Sie auf dem Broadcom Support Portal.
VM-Leistungsprobleme Leistungsprobleme können durch CPU-Einschränkungen, Speicherüberbelegung, Speicherlatenz oder Netzlatenz verursacht werden.
Bare-Metal-Server ist inaktiv Wenn der Bare-Metal-Server, auf dem vSphere ESXi ausgeführt wird, nicht reagiert oder inaktiv ist, melden Sie sich bei der IBM Cloud Management-Benutzerschnittstelle oder -Konsole an und überprüfen Sie den Status. Falls erforderlich, öffnen Sie einen Fall, um Unterstützung für Ihren Bare Metal Server zu erhalten. Weitere Informationen finden Sie in Supportfälle verwalten.
vSphere ESXi-Host ist getrennt oder reagiert nicht Weitere Informationen finden Sie unter Fehlerbehebung bei einem ESXi/ESX-Host, der nicht reagiert(1003409 ).
Purpurrote Diagnoseanzeige Fehler mit purpurroter Anzeige können auf eine Kernelpanik hinweisen. Der ESXi-Kernel vSphere vmkernel löst diese Sicherheitsmaßnahme als Reaktion auf ein nicht behebbares Ereignis oder einen nicht behebbaren Fehler aus. Ein nicht behebbarer Fehler bedeutet, dass die Fortsetzung der Ausführung ein hohes Risiko für die Services und VMs darstellt. Wenn die Panik auftritt und der vSphere-ESXi-Host abstürzt, beendet er alle Services, die auf ihm ausgeführt werden, zusammen mit allen virtuellen Maschinen, die gehostet werden. Die VMs werden nicht ordnungsgemäß heruntergefahren, sondern abrupt ausgeschaltet. Wenn der Host Teil eines Clusters ist und Sie HA konfiguriert haben, werden diese VMs auf den anderen Hosts im Cluster erneut gestartet. Weitere Informationen finden Sie auf dem Broadcom Support Portal.
Typische Fehlerbehebung bei der Lagerung
Titel Beschreibung
Speicherfehlerbehebung Probleme können durch langsame Leistung, unvorhersehbare Ausfälle, Festplattenbeschädigung oder VM-Beschädigung verursacht werden.
vSAN-Fehlerbehebung Weitere Informationen finden Sie unter Fehlerbehandlung in vSAN.
vSAN-Plattenfehler Weitere Informationen zur Identifizierung eines bestimmten Festplattenfehlers in einem vSAN-Deduplizierungscluster finden Sie unter "Identifizieren eines bestimmten Festplattenfehlers in einem vSAN-Deduplizierungscluster(2149067 )".
Beheben von Problemen mit dem vSAN-Status Auf der Seite 'Überwachung' von VMware vSphere Web Client werden möglicherweise Alerts und Warnungen für Probleme im Zusammenhang mit dem vSAN-Status angezeigt. Weitere Informationen zur Behebung dieser Probleme finden Sie unter " Virtual SAN-Statusmeldungen und -Warnungen ".
vSAN-Neuverteilung Wenn Platten in der Statusprüfung Fehler melden, die darauf hinweisen, dass der Cluster unausgeglichen ist, sind die Platten bei der Speicherbelegung hoch, während andere niedrig sind, und Sie müssen eine proaktive Neuverteilung ausführen. Eine manuell initiierte Neuverteilung der Objekte in einem vSAN-Cluster beginnt. Weitere Informationen über die proaktive Neuausrichtung von vSAN und wann sie anwendbar sein könnte, finden Sie unter vSAN proaktive Neuausrichtung(2149809 ).
Starten eines vSAN-Statustests Wenn Sie ein Problem mit vSAN vermuten, können Sie einen Allgemeinzustandstest einleiten, um zu überprüfen, ob die Clusterkomponenten wie erwartet funktionieren. Wenn Sie einen Test der VM-Erstellung ausführen, wird auf jedem Host im Cluster eine VM erstellt und wieder gelöscht. Werden diese Tasks erfolgreich ausgeführt, funktionieren die Clusterkomponenten wie erwartet, und der Cluster kann verwendet werden. Anschließend wird ein Netzwerkleistungstest durchgeführt, um Verbindungsprobleme zu erkennen und zu diagnostizieren und sicherzustellen, dass die Netzwerkbandbreite zwischen den Hosts ausreichend ist. Weitere Informationen finden Sie unter Proaktive Tests.
Überwachen der vSAN-Leistung Weitere Informationen finden Sie unter "Überwachung der vSAN-Leistung ". Leistungsdiagramme stehen für Cluster, Hosts, physische Platten, VMs und virtuelle Platten zur Verfügung.
vSAN-Fehlerbehebung Weitere Informationen finden Sie unter Fehlerbehebung und Fehlerbehebung vSAN.
Typische Netzwerk-Fehlerbehebung
Titel Beschreibung
NSX Edge /var/log wird voll auf aktive Edge Weitere Informationen finden Sie unter Fehlerbehebung bei Problemen mit dem Festplattenspeicher: NSX für vSphere.
Testen der HCX-Bandbreite Wenn Sie glauben, dass Sie ein Problem mit der Netzbandbreite mit HCX haben, verwenden Sie perftest, um die verfügbare Bandbreite innerhalb der HCX-Tunnel zu finden. Weitere Informationen finden Sie unter "Schritte zum Ausführen von Perftest in HCX(56211 )". Für jeden Perftest (perftest) werden bidirektionale Tests durchgeführt. Ein Gateway des Gateway-Paars befindet sich im Quellenrechenzentrum (vor Ort) und das andere in IBM Cloud. Unter Verwendung von perftest wird getestet, ob der vom Absender erzielte Durchsatz so hoch wie die für die Verbindung mögliche Kapazität ist. Deshalb wird für jeden Test eine höhere Absenderrate als Empfängerrate angezeigt. Sie können den Wert der Empfängerrate als Ergebnis des unidirektionalen Durchsatzes betrachten.
Fehlerbehebung für HCX Weitere Informationen finden Sie unter Fehlerbehebung für HCX.
HCX-Synchronisation mit 0 % Fortschritt und 0 Bytes und dem Status 'Fehler' HCX - Gesundheitscheck und bewährte Praktiken.
Schlechte VM-Netzleistung Überprüfen Sie die Einstellungen für virtuelle NICs der VM. VMware empfiehlt VMXNET 3 virtuelle NICs für VMs, da es sich um die neueste Generation paravirtualisierter NICs handelt, die für die Leistung entwickelt wurden. Prüfen Sie die Kompatibilität von VMXNET 3 anhand der VMware-Kompatibilitätsliste. Wird VMXNET 3 unterstützt, ändern Sie den virtuellen NIC, um zusätzliche Netzleistung zu erhalten. Weitere Informationen finden Sie unter Fehlersuche im Netzwerk.
Typische vCenter
Titel Beschreibung
VM-Konsolenzugriff Weitere Informationen finden Sie unter Verwenden der Konsole einer virtuellen Maschine.
Neues vCenter Server-Zertifikat scheint nicht geladen zu werden Nach dem Ersetzen der Standard-Zertifikate von vCenter werden die neuen Zertifikate möglicherweise nicht geladen. Weitere Informationen finden Sie unter Neues vCenter-Serverzertifikat wird anscheinend nicht geladen.
vCenter Server kann keine Verbindung zu verwalteten Hosts herstellen Nach dem Ersetzen der Standard-Zertifikate für vCenter und dem Neustart des Systems kann VMware vCenter® Server Appliance (VCSA) keine Verbindung zu verwalteten Hosts herstellen. Weitere Informationen erhalten Sie unter vCenter. Der Server kann keine Verbindung zu verwalteten Hosts herstellen.
Konfigurieren von vSphere HA nicht möglich, wenn benutzerdefinierte SSL-Zertifikate verwendet werden Nach der Installation von benutzerdefinierten SSL-Zertifikaten schlagen Versuche, vSphere HA zu aktivieren, fehl. Weitere Informationen finden Sie unter "Cannot configure vSphere HA when you use custom SSL certificates ".
Typische Fehlerbehebung bei Lizenzen
Titel Beschreibung
Inkompatible oder falsche Konfiguration von Lizenzen Weitere Informationen finden Sie unter Fehlerbehebung bei der Host-Lizenzierung.
VM lässt sich nicht einschalten Möglicherweise liegt ein Lizenzproblem vor, wenn Sie eine VM auf einem vSphere ESXi-Host nicht einschalten können und die Meldung The 60-day evaluation period of the host is expired or the license of the host is expired angezeigt wird. Weitere Informationen finden Sie unter "Virtuelle Maschine kann nicht eingeschaltet werden ".
Eine Funktion ist nicht verfügbar oder eine Konfiguration kann nicht geändert werden Weitere Informationen finden Sie unter "Eine Funktion kann nicht konfiguriert oder verwendet werden ".