IBM Cloud Docs
Resolución de problemas

Resolución de problemas

Revise la siguiente información para solucionar los problemas de su instancia de VMware Cloud Foundation for Classic - Automated. Los administradores del sistema deben identificar los síntomas del problema, determinar los componentes de la solución afectados, investigar y proponer un arreglo o un método alternativo, y probar el arreglo.

  • Identificación de síntomas. Varias causas potenciales podrían llevar al bajo rendimiento o al incumplimiento de su instancia. El primer paso para una resolución de problemas eficaz consiste en identificar exactamente qué es lo que va mal. Es posible que se notifiquen estos síntomas desde los sucesos y alarmas de VMware vSphere®, Gestión de operaciones en IBM Cloud® o el Servicio de atención al usuario de uno de sus usuarios.
  • Aislamiento de los componentes afectados. Después de identificar los síntomas del problema, debe identificar los componentes de software o hardware afectados. Identifique si pueden estar provocando el problema y determine los componentes que no estén implicados. Para ayudarle en este paso, dispone de herramientas tales como vCenter Operations Management en IBM Cloud.
  • Proposición de un arreglo o un método alternativo. Después de conocer los síntomas y aislar los componentes, puede investigar los posibles arreglos y las soluciones temporales. Los administradores del sistema también utilizan el portal de IBM Cloud, incluyendo los escenarios de resolución de problemas de este documento, IBM ServiceNow y la base de conocimiento de VMware. Además, puede encontrar muchos wikis y blogs que pueden ser útiles. Para resoluciones aún más rápidas, Operations Management en IBM Cloud incluye una serie de remedios para problemas identificados.
  • Prueba de las posibles soluciones. Cuando ya conoce los síntomas y los componentes implicados y tiene un arreglo o un método alternativo, los administradores del sistema prueban sistemáticamente las soluciones hasta que se resuelva el problema.

vSphere incluye un subsistema configurable por el usuario de sucesos y alarmas que hace un seguimiento de los sucesos que se producen en todo el entorno de vSphere y almacena los datos en archivos de registro y en la base de datos de vCenter. Este subsistema también permite a los administradores del sistema especificar las condiciones bajo las que se desencadenan las alarmas. Las alarmas cambian de estado, desde avisos a alertas más serias a medida que cambian las condiciones del sistema, y pueden desencadenar acciones de alarma automatizadas, tales como enviar un correo electrónico al equipo de administración del sistema. Esta función es muy útil cuando desea que se le informe o que se realice una acción inmediata cuando se produzcan determinados sucesos o condiciones para un determinado objeto de inventario o grupo de objetos.

Otras herramientas adicionales, como las incorporadas en la arquitectura de Operations Management on IBM Cloud proporcionan una mayor asistencia en: identificar síntomas, aislar los componentes afectados y proponer un arreglo o solución temporal.

Directrices

Las indicaciones siguientes se consideran las mejores prácticas para la resolución de su problema de IBM Cloud for VMware Solutions.

  • Aborde la resolución de problemas de forma sistemática.
  • Estos son los síntomas relacionados con la disponibilidad, el uso o la configuración:
    • Disponibilidad - Estos síntomas están relacionados con la disponibilidad de componentes de hardware y software y se caracterizan por una falta de respuesta. A menudo, el diseño de alta disponibilidad (HA) enmascara estos problemas para que no afecten directamente a sus cargas de trabajo y usuarios.
    • Uso: estos síntomas se relacionan con la capacidad y el rendimiento, y están tipificados por el lento funcionamiento o la incapacidad de carga. La gestión proactiva de la capacidad reduce drásticamente estos problemas.
    • Configuración: estos problemas suelen detectarse en la prestación de nuevos servicios o como resultado de la aplicación de un cambio. Los valores incorrectos pueden surgir como síntomas de disponibilidad o de uso. Por ejemplo, una dirección IP incorrecta se muestra como un problema de disponibilidad, mientras que unos valores de RAM de máquina virtual (VM) bajos provocan síntomas de uso.
  • Intente aislar el problema en un componente del entorno.
  • Tome notas para poder rastrear los pasos.
  • Entienda y documente sus versiones de software.
  • Documente su subred y el uso de direcciones IP, incluidas las direcciones VIP y NAT.
  • Tanga diagramas en su red. Necesita varios diagramas que muestren las capas físicas (underlay) y lógicas (overlay).
  • Comprenda los cambios recientes en el entorno.
  • Investigue el impacto de la solución; no se bloquee a sí mismo fuera de ninguna interfaz de gestión.
  • Asegúrese de tener copias de seguridad de todos los componentes clave, por si se tienen que volver a cargar o restablecer.
  • No cambie más de una cosa a la vez.
  • Documente cada cambio y su resultado.
  • Al hacer una solicitud de soporte, asegúrese de documentar cuidadosamente y proporcionar la información pertinente. Tenga claro los síntomas que está viendo e identifique los componentes que cree que son defectuosos. Asegúrese de utilizar la terminología correcta. Intente minimizar cualquier malentendido o ambigüedad en su elección de palabras.
  • vSphere VMware Los archivos de configuración ESXi y vCenter® controlan el comportamiento del sistema. La mayoría de los valores de los archivos de configuración se establecen durante la instalación, pero se pueden modificar después de ésta.
  • Los archivos de registro capturan los mensajes generados por el kernel y los distintos subsistemas y servicios. Los servicios de vSphere ESXi y vCenter mantienen archivos de registro separados. Debe saber dónde están ubicados y cómo se puede acceder a ellos.
  • Comprenda cómo utilizar las herramientas de administración de sistemas populares para obtener ayuda en los diagnósticos.

Resolución de problemas con archivos de registro

Los archivos de registro son una excelente fuente de información para resolver problemas. Sin embargo, el número de archivos de registro y el gran número de entradas en cada registro dificultan el diagnóstico. Ubicación de los archivos de registro para los productos de VMware(1021806) detalla dónde se encuentran estos archivos de registro en el entorno de VMware. Debido al número de archivos de registro y al gran número de entradas en cada registro, se recomienda utilizar las herramientas de Gestión de operaciones en IBM Cloud para capturar y analizar los registros de sucesos.

Resolución de problemas con escenarios comunes

Para ayudar a aislar los componentes afectados, esta documentación sobre la resolución de problemas comunes se clasifica en las siguientes categorías.

  • Máquinas virtuales: estos temas de resolución de problemas proporcionan directrices para los problemas potenciales de las máquinas virtuales.
  • Hosts: temas de resolución de problemas que proporcionan directrices sobre los problemas de host de vSphere ESXi.
  • Almacenamiento: temas de resolución de problemas que proporcionan directrices para resolver los problemas de almacenamiento de vSAN y NFS.
  • Red: temas de resolución de problemas que proporcionan directrices para resolver los problemas de red.
  • vCenter: temas de resolución de problemas que proporcionan directrices para resolver los problemas de vCenter.
  • Licencias: temas de resolución de problemas que proporcionan directrices para resolver los problemas de licencia, normalmente relacionados con los clientes que tienen sus propias licencias en IBM Cloud.
Solución de problemas de máquinas virtuales
Título Descripción
Resolución de problemas genérico de VM Para obtener más información, consulte Resolución de problemas de máquinas virtuales.
Problemas de rendimiento de VM Puede resolver los síntomas de los problemas de rendimiento de VM, incluido el inicio lento del sistema operativo invitado, las aplicaciones que experimentan un mal rendimiento, las aplicaciones que tardan mucho en iniciarse o las aplicaciones que no responden.
Recuperar VM huérfanas Las máquinas virtuales huérfanas son máquinas virtuales que existen en la base de datos de vCenter, pero que no reconoce el host de vSphere ESXi. Para obtener más información sobre la recuperación de máquinas virtuales huérfanas, consulte Recuperación de máquinas virtuales huérfanas.
Una VM no se enciende Para obtener más información, consulte Solución de problemas de una máquina virtual que no se enciende(2001005 ).
La VM no se enciende después de clonarla o desplegarla desde una plantilla La implementación de máquinas virtuales analiza los problemas que afectan a una máquina virtual después de que se clona o se implementa a partir de una plantilla.
Dispositivos de red de VM antiguos Para los dispositivos de red de VM que no se mantienen actualizados, es posible que el rendimiento de la red y la aplicación se vean afectados. Para obtener más información sobre la implementación de un nuevo dispositivo y controlador de red virtual, consulte Elección de un adaptador de red para su máquina virtual(1001805 ).
Límite de memoria de máquina virtual A menudo se utilizan límites de memoria. No obstante, si un sistema operativo invitado no puede acceder a la memoria que necesita, es posible que las aplicaciones dentro del sistema operativo invitado tengan un mal rendimiento. Para obtener más información sobre cómo resolver el problema, consulte Configuración de los ajustes de asignación de recursos.
Instantáneas de VM Aunque las instantáneas son útiles, la cantidad y la antigüedad de las instantáneas de una VM tienen un impacto directo en el rendimiento de la VM. Para obtener más información sobre cómo resolver el problema, consulte Consolidar instantáneas.
Registro de VM Cuando el registro no está configurado correctamente, la capacidad del almacén de datos podría verse afectada negativamente. Para obtener más información sobre cómo resolver el problema, consulte Configuración de los niveles de registro para el SO invitado.
Resolución de problemas de conexión de red Los síntomas pueden incluir VM que no se pueden conectar a la red, o que no hay conectividad de red hacia o desde una máquina virtual. Para obtener más información sobre cómo resolver el problema, consulte Solución de problemas de conexión de red de máquinas virtuales(1003893 ).
Determinar si varias CPU virtuales provocan problemas de rendimiento Estos problemas pueden incluir velocidades de transferencia deficientes cuando copian datos en o desde una máquina virtual, si los trabajos de copia de seguridad exceden el tiempo de espera o son lentos, o si una VM tiene un mal rendimiento.
Una VM se ha apagado o reiniciado Para obtener más información, consulte Determinar por qué se apagó o reinició una máquina virtual(1019064 ).
Una o más de las máquinas virtuales tiene un tiempo de respuesta pobre Los problemas de rendimiento pueden deberse a restricciones de CPU, sobreasignación de memoria, latencia de almacenamiento o latencia de red.
Solución de problemas típicos de hosts vSphere ESXi
Título Descripción
Mandatos ESXI Para obtener una descripción general de las interfaces de línea de comandos en vSphere,, los comandos de ESXi Shell y los comandos de la interfaz de línea de comandos de vCLI ( VMware® vSphere ), consulte Introducción a las interfaces de línea de comandos de vSphere.
Estados de host de alta disponibilidad de vSphere Si vCenter notifica un estado de host de alta disponibilidad de vSphere que indica una condición de error en el host, estos problemas deben remediarse. Estos problemas pueden impedir que la alta disponibilidad de vSphere reinicie las máquinas virtuales después de un error. Para más información, consulte Solución de problemas de estados de host de vSphere HA.
vSphere El host ESXi está en un estado de no respuesta Un estado de no respuesta incluye Not Responding, Disconnected o las máquinas virtuales en el host que se muestran como Unavailable en vCenter. Para obtener más información sobre cómo solucionar un host ESXi de vSphere, que no responde, consulte Los hosts ESX/ESXi no responden y están atenuados(1019082 ).
Cuando se enciende una máquina virtual, aparece un error File not found Para obtener más información, busque en el Portal de soporte de Broadcom.
Problemas de rendimiento de VM Los problemas de rendimiento pueden deberse a restricciones de CPU, sobreasignación de memoria, latencia de almacenamiento o latencia de red.
El servidor nativo está inactivo Cuando el servidor nativo que ejecuta vSphere ESXi no responde o está inactivo, inicie una sesión en la interfaz de usuario o la consola de gestión de IBM Cloud compruebe el estado. Si es necesario, abra un caso para obtener ayuda con el servidor nativo. Para obtener más información, consulte Gestión de casos de soporte.
El host ESXi de vSphere está desconectado o no responde Para obtener más información, consulte Solución de problemas de un host ESXi/ESX en estado de no respuesta(1003409 ).
Pantalla de diagnósticos púrpura Los errores de pantalla púrpura pueden indicar un estado de pánico del kernel. El núcleo ESXi vSphere vmkernel activa esta medida de seguridad en respuesta a un evento o error irrecuperable. Un error irrecuperable significa que continuar la ejecución representa un alto riesgo para los servicios y las máquinas virtuales. Cuando cunde el pánico y el host de vSphere ESXi se bloquea, finaliza todos los servicios que se ejecutan en él, junto con todas las máquinas virtuales alojadas. Las máquinas virtuales no se apagan ordenadamente, sino que se apagan de forma abrupta. Si el host forma parte de un clúster y ha configurado la alta disponibilidad, estas máquinas virtuales se vuelven a iniciar en los otros sistemas principales del clúster. Para obtener más información, busque en el Portal de soporte de Broadcom.
Solución de problemas típicos del almacenamiento
Título Descripción
Resolución de problemas de almacenamiento Los problemas pueden deberse a un rendimiento lento, fallos impredecibles, daños en el disco o daños en la máquina virtual.
Resolución de problemas de vSAN Para más información, consulte Manejo de fallos en vSAN.
Error de disco de vSAN Para obtener más información sobre cómo identificar un fallo de disco específico en un clúster de deduplicación de e vSAN, consulte Identificación de fallos de disco específicos en un clúster de deduplicación de e vSAN.
Borrar problemas de estado de vSAN En página de supervisión del cliente web de VMware vSphere, puede ver alertas y avisos relacionados con problemas de estado de vSAN. Para obtener más información sobre cómo solucionar estos problemas, consulte Alertas y advertencias de estado de SAN virtual.
Reequilibrio de vSAN Si los discos notifican errores en la comprobación de estado que indican que el clúster está desequilibrado y que unos discos realizan un elevado uso del espacio, mientras que otros no, debe ejecutar un reequilibrio proactivo. Se ejecuta un reequilibrio iniciado manualmente de los objetos en un clúster vSAN. Para obtener más información sobre el reequilibrio proactivo de vSAN y cuándo podría ser aplicable, consulte el reequilibrio proactivo de vSAN(2149809 ).
Iniciar prueba de salud de vSAN Si sospecha de un problema con vSAN, puede iniciar una prueba de estado para verificar que los componentes del clúster funcionan según lo esperado. La ejecución de la prueba de creación de VM crea una máquina virtual en cada host del clúster y, a continuación, la suprime. Si estas tareas se ejecutan correctamente, significa que los componentes del clúster funcionan como se espera y el clúster funciona bien. A continuación, se utiliza la prueba de rendimiento de la red para detectar y diagnosticar problemas de conectividad y para garantizar que el ancho de banda de la red entre los hosts sea adecuado. Para obtener más información, consulte Pruebas proactivas.
Supervisión del rendimiento de vSAN Para obtener más información, consulte Supervisión del rendimiento de vSAN. Hay gráficos de rendimiento disponibles para clústeres, hosts, discos físicos, máquinas virtuales y discos virtuales.
Resolución de problemas de vSAN Para obtener más información, consulte Manejo de fallos y resolución de problemas vSAN.
Solución de problemas típicos de la red
Título Descripción
NSX Edge /var/log se está llenando en Active Edge Para obtener más información, consulte Solución de problemas relacionados con el espacio en disco: NSX para nodos vSphere.
Prueba del ancho de banda de HCX Si considera que tiene un problema de ancho de banda de red con HCX, utilice perftest para encontrar el ancho de banda disponible dentro de los túneles de HCX. Para obtener más información, consulte Pasos para ejecutar perftest en HCX(56211 ). Se realizan pruebas bidireccionales para cada perftest. Para el par de pasarelas, una se encuentra dentro del centro de datos de origen (en local) y el otro está en IBM Cloud. La forma como funciona el rendimiento de perftest es que el emisor intente enviar tan rápido como el enlace pueda soportar. Por lo tanto, para cada prueba, podrá ver una tasa de "remitente" mayor que la de "destinatario". Se puede considerar la tasa de "destinatario" como un resultado de rendimiento en un solo sentido.
Resolución de problemas de HCX Para obtener más información, consulte Resolución de problemas de HCX.
Estado de sincronización de HCX con 0% de progreso y 0 bytes con estado error HCX - Chequeo y buenas prácticas.
Rendimiento de red de la VM bajo Revise los valores de NIC virtual de la VM. VMware recomienda los NIC virtuales de VMXNET 3 para las máquinas virtuales, ya que es la generación más reciente de NIC paravirtualizadas diseñadas para el rendimiento. Compruebe la compatibilidad de VMXNET 3 utilizando la lista de compatibilidad de VMware y, si es compatible, cambie el NIC virtual para un mejor rendimiento de red. Para obtener más información, consulte Solución de problemas de red.
Solución de problemas típicos vCenter
Título Descripción
Acceso a la consola de máquina virtual Para obtener más información, consulte Uso de la consola de una máquina virtual.
El nuevo certificado de servidor de vCenter no parece que se cargue Después de reemplazar los certificados de vCenter predeterminados, es posible que los nuevos certificados no aparezcan cargados. Para más información, consulte Nuevo servidor de vCenter. El certificado no parece cargarse.
vCenter Server no se puede conectar a los hosts gestionados Después de reemplazar los certificados de vCenter predeterminados y reiniciar el sistema, el dispositivo de servidor de vCenter® (VCSA) de VMware no puede conectarse a los hosts gestionados. Para obtener más información, consulte vCenter El servidor no puede conectarse a los hosts gestionados.
No se puede configurar vSphere HA cuando se utilizan certificados SSL personalizados Después de la instalación de certificados SSL personalizados, los intentos de habilitar vSphere HA fallan. Para obtener más información, consulte No se puede configurar un certificado SSL personalizado(vSphere)cuando se utilizan certificados SSL personalizados.
Solución de problemas típicos de las licencias
Título Descripción
Configuración de licencias no compatible o incorrecta Para obtener más información, consulte Solución de problemas de licencias de host.
Una VM no se enciende Es posible que exista un problema de licencia si no puede encender una máquina virtual en un host de vSphere ESXi y recibe el mensaje The 60-day evaluation period of the host is expired or the license of the host is expired. Para obtener más información, consulte No se puede encender una máquina virtual.
Una característica no está disponible o no se puede cambiar una configuración Para obtener más información, consulte No se puede configurar ni utilizar una función.