警报
简介
VMware vSphere® 包括一个事件和警报子系统,它跟踪 vSphere 环境中发生的事件,并在 vCenter 中提供这些信息。 本子系统使用以下术语。
事件
事件是 vCenter 中对象(例如,主机和虚拟机 (VM))上发生的系统或用户操作的记录。 事件数据包含有关事件的详细信息,例如事件生成方、事件发生时间以及事件类型。 在 vSphere Web Client 中,事件数据显示在“监视”选项卡中。
以下是活动分类。
- 错误 - 表示系统出现无法恢复的问题,并结束进程或操作。
- 警告 - 表示系统存在潜在风险,需要修复。 该事件不会终止流程或操作。
- 参考 - 描述用户或系统操作已成功完成。
- 审计 - 审计日志数据包含有关操作描述、操作执行者、操作执行时间以及用户 IP 地址的信息。
警报
警报是为了响应事件、一组条件或清单对象状态而激活的通知。
警报定义由 vSphere 客户端中的以下元素组成。
- 名称和描述 - 提供标识性标签和描述。
- 目标 - 定义受监视对象的类型。
- 警报规则 - 定义触发警报的事件、条件或状态,以及定义通知严重性。 此外,还定义为了响应触发的警报而执行的操作。
- 上次修改时间 - 上次修改已定义警报的日期和时间。
警报的严重程度如下。
- 正常 - 绿色。
- 警告 - 黄色。
- 警报 - 红色。
警报定义
警报定义与清单中选择的对象相关联,并监视其定义中指定的清单对象的类型。
警报定义由以下要素组成。
- 名称和描述 - 提供标识性标签和描述。
- 警报类型 - 定义受监视对象的类型。
- 触发器 - 定义触发警报的事件、条件或状态,以及定义通知严重性。
- 容错阈值(报告)- 提供对条件和状态触发器阈值的更多限制,必须超过这些阈值后方可触发警报。
- 操作 - 定义为了响应触发的警报而执行的操作。 VMware 提供了特定于清单对象类型的预定义操作集。
- 警报操作 - 警报操作是为了响应触发器而执行的操作。 例如,您可以在触发警报时向一个或多个管理员发送电子邮件通知。
- 确认触发的警报 - 确认警报后,将停止警报操作。 确认警报后,不会清除或重置警报。 确认警报会向其他用户发出信号,让他们知道你正在主动处理问题。
- 重置触发的警报 - 如果 vCenter 检索不到标识正常条件的事件,那么事件触发的警报可能无法重置为正常状态。 在此类情况下,请手动重置警报。
- 预配置的 vSphere 警报 - vSphere 事件和警报子系统有若干缺省警报,用于监视 vSphere 清单对象的操作。 您必须为这些警报设置操作。
警报设置工作流程
VMware vCenter 提供预配置的警报,这些警报在下表中进行了说明,但警报设置的操作只能在 Web 客户端中显示。vCenter 配置 SMTP 服务器详细信息,然后设置警报操作,以便在初始阶段仅针对以下警报向系统管理员发送电子邮件,从而避免系统管理员团队被淹没。 更多信息,请参阅 “发送电子邮件作为警报操作”。
设置警报的工作流程如下。
- 配置 SMTP 服务器详细信息。
- 为群集、主机、数据存储和关键虚拟设备(如 VMware vCenter®、PSC、NSX Manager 和控制器)配置警报操作。
- 群集 - VMware 高可用性 (HA) 错误。
- 主机 - CPU 状态、内存状态、存储器状态和硬件状态(即电压、温度或电源状态更改)。
- 数据存储 - 可用磁盘空间不足。
- 关键虚拟设备 - CPU 使用率、内存使用率和磁盘等待时间
- 使用主动式日常任务查看以下信息。
- 检查发送的警报 - 是否需要警报?
- 复查未发送的警报 - 是否需要了解有关这些警报的信息?
- 审查衡量标准--衡量标准是否正确? 例如,确认 CPU 使用率必须设置为 75%,而不是 90%。
- 是否需要配置您自己的警报?
- 是否需要包含虚拟机?
典型警报工作流程
设置完成后,请查看以下警报触发时系统管理员通常采用的警报工作流程示例。
- 主机设置了用于监视 CPU 使用率的警报,并且该警报的警报操作是在触发警报时向管理员发送电子邮件,如先前部分中所述。
- 主机 CPU 使用率激增,触发了警报,从而向管理员发送电子邮件。
- 其中一名管理员登录 vCenter 并确认触发的警报,以便让其他管理员知道问题正在得到解决,并防止警报发送更多电子邮件。 但是,警报仍会在系统中显示。
- 管理员找到导致 CPU 峰值的原因并进行纠正。
- 警报自动重置。
预配置的警报 - 标准
- 警报名称 - 在 vCenter 中显示的警报的名称。
- 使用指南 - IBM Cloud for VMware Solutions 本警报器的使用指南。
- 更多信息 - 可从 IBM 或 VMware 获取更多信息,以便在触发警报时帮助解决这些问题。
下表描述了标准预配置警报。
警报名称 | 指导信息 | 详细信息 |
---|---|---|
主机连接和电源状态 | 配置为未响应或待机时发送一次电子邮件。 | 当 ESXi 主机从待机状态唤醒时发出 "主机连接和电源状态 "警报 |
主机 CPU 使用率 | 配置为当主机 CPU 使用率 > 90% 持续 5 分钟时发送一次电子邮件。 | 知识 - KB0012707v0.01 |
主机内存使用率 | 配置为当主机内存使用率 > 95% 持续 5 分钟时发送一次电子邮件。 | 知识 - KB0012712 v0.01 |
虚拟机 CPU 使用率 | 对关键设备进行配置,当虚拟机 CPU 使用率 > 90% 时发送电子邮件一次,持续 5 分钟。 | 为虚拟机硬盘使用设置警报 |
虚拟机内存使用率 | 配置在关键设备的虚拟机内存使用率 > 95% 时发送一次电子邮件,持续 5 分钟。 | 针对 ESXi 中某些类型的虚拟机触发内存使用警报 |
磁盘上的数据存储使用率 | 对于 vSAN, 配置为当数据存储使用率 > 70% 时发送一次电子邮件。 对于 non-vSAN, 配置为当数据存储使用率 > 85% 时发送一次电子邮件。 | 知识 - KB0012713 v0.01 |
虚拟机 CPU 就绪时间 | 对关键设备进行配置,当虚拟机 CPU 就绪时间 > 2000 毫秒时发送一次电子邮件,持续 5 分钟。 | 知识 - KB0012718 v0.01 |
虚拟机磁盘总等待时间 | 配置在关键设备的虚拟机总磁盘延迟 > 30 毫秒时发送一次电子邮件,持续 5 分钟。 | 知识 - KB0012729 v0.01 |
虚拟机磁盘命令已取消 | 初始未设置。 在第二阶段考虑关键设备。 | 无其他信息 |
虚拟机磁盘重置 | 初始未设置。 在第二阶段考虑关键设备。 | 无其他信息 |
许可证清单监视 | 不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | 许可故障排除 |
许可证用户阈值监视 | 不视为有必要通知。 在每天的主动检查中都会对警报器进行检查。 | 许可故障排除 |
许可容量监视 | 不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | 许可故障排除 |
主机许可证版本与 vCenter Server 许可证版本不兼容 | 不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | 对主机许可进行故障排除 |
启动辅助 VM 时超时* | 未配置,因为它会监控 VMware 容错,不建议用于 VMware Cloud Foundation for Classic - Automated 实例。 | 无其他信息 |
辅助 VM 的主机不兼容 | 未配置,因为它会监控 VMware 容错,不建议用于 VCF for Classic - Automated 实例。 | 无其他信息 |
虚拟机容错状态已更改 | 未配置,因为它会监控 VMware 容错,不建议用于 VCF for Classic - Automated 实例。 | 无其他信息 |
虚拟机容错 vLockStep 时间间隔状态已更改 | 未配置,因为它会监控 VMware 容错,不建议用于 VCF for Classic - Automated 实例。 | 无其他信息 |
主机处理器状态 | 配置在监视器从绿色变为红色时发送一次电子邮件。 | 联系 IBM 支持 |
主机内存状态 | 配置在监视器从绿色变为红色时发送一次电子邮件。 | 联系 IBM 支持 |
主机硬件风扇状态 | 配置在监视器从绿色变为红色时发送一次电子邮件。 | 联系 IBM 支持 |
主机硬件电压 | 配置在监视器从绿色变为红色时发送一次电子邮件。 | 联系 IBM 支持 |
主机硬件温度状态 | 配置在监视器从绿色变为红色时发送一次电子邮件。 | 联系 IBM 支持 |
主机硬件电源状态 | 配置在监视器从绿色变为红色时发送一次电子邮件。 | 联系 IBM 支持 |
主机硬件系统板状态 | 配置在监视器从绿色变为红色时发送一次电子邮件。 | 联系 IBM 支持 |
主机电池状态 | 配置在监视器从绿色变为红色时发送一次电子邮件。 | 联系 IBM 支持 |
其他主机硬件对象的状态 | 配置在监视器从绿色变为红色时发送一次电子邮件。 | 联系 IBM 支持 |
主机存储器状态 | 配置在监视器从绿色变为红色时发送一次电子邮件。 | 联系 IBM 支持 |
主机 IPMI 系统事件日志状态 | 未配置,因为此警报不会影响服务。 | 联系 IBM 支持 |
主机基板管理控制器状态 | 配置在监视器从绿色变为红色时发送一次电子邮件。 | 联系 IBM 支持 |
主机错误* | 配置在监视器变为错误时发送一次电子邮件。 | 联系 IBM 支持 |
虚拟机错误* | 对关键设备进行配置,在关键时刻发送一次电子邮件。 | 虚拟机故障诊断 |
主机连接失败* | 配置为在事件为 Cannot connect host - network error 或 Cannot connect host - timeout 或 Host connection lost zs 时发送一次电子邮件。 |
当 ESXi 主机从待机状态唤醒时发出 "主机连接和电源状态 "警报 |
在启用了 SIOC 的数据存储上检测到非受管工作负载 | 未配置,因为此警报不会影响服务。 | 在运行 SIOC 的数据存储上检测到未托管工作负载(1020651) |
超过了自动精简配置卷容量阈值 | 不在 VCF for Classic - Automated 实例中配置,因为它们不支持 VASA 存储。 | 无其他信息 |
数据存储功能警报 | 不在 VCF for Classic - Automated 实例中配置,因为它们不支持 VASA 存储。 | 无其他信息 |
VASA 提供者已断开连接 | 不在 VCF for Classic - Automated 实例中配置,因为它们不支持 VASA 存储。 | 无其他信息 |
VASA 提供者证书到期警报 | 不在 VCF for Classic - Automated 实例中配置,因为它们不支持 VASA 存储。 | 无其他信息 |
VM 存储合规性警报 | 不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | 虚拟机存储合规性警报(2061940) |
数据存储合规性警报 | 不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | 使用数据存储 |
刷新 VASA 提供者的 CA 证书和 CRL 失败 | 不在 VCF for Classic - Automated 实例中配置,因为它们不支持 VASA 存储。 | 无其他信息 |
vSphere HA 故障转移资源不足 | 配置为在关键时刻一次性发送电子邮件。 | 知识 - KB0012739 v0.01 |
正在执行 vSphere HA 故障转移 | 不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | 无其他信息 |
无法找到 vSphere HA 主代理 | 配置为在无法找到 HA 主代理或无法与 HA 主代理通信时发送一次电子邮件。 | vSphere 可用性 |
vSphere HA 主机状态 | 配置在下列情况下发送一次电子邮件 vSphere 主机上的 HA 代理出错,vSphere HA 检测到网络隔离主机,vSphere HA 检测到网络分区主机,或 vSphere HA 检测到主机故障。 | 故障排除 vSphere HA 主机状态 |
vSphere HA 虚拟机故障转移失败 | 对关键设备进行配置,在关键时刻发送一次电子邮件。 | 创建和使用 vSphere HA 群集 |
vSphere HA 虚拟机监视操作 | 对关键设备进行配置,在关键时刻发送一次电子邮件。 | 创建和使用 vSphere HA 群集 |
vSphere HA 虚拟机监视错误 | 对关键设备进行配置,在关键时刻发送一次电子邮件。 | 创建和使用 vSphere HA 群集 |
vSphere HA VM 组件保护功能无法关闭虚拟机电源 | 对关键设备进行配置,在关键时刻发送一次电子邮件。 | 创建和使用 vSphere HA 群集 |
许可证错误* | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 许可故障排除 |
运行状态已更改* | 配置在状态变为关键时发送一次电子邮件。 | 对主机进行故障排除 |
Storage DRS 建议 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | DRS 故障排除信息 |
主机上不支持 Storage DRS | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | DRS 故障排除信息 |
数据存储集群的空间不足 | 当磁盘使用率超过 85% 时,配置为在关键时刻发送一次电子邮件。 | 为 VCF for Classic - Automated 实例添加 NFS 存储 |
数据存储位于多个数据中心 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 无其他信息 |
vSphere 分布式交换机内中继的 VLAN 的状态 | 当 vSphere Distributed Switch 中配置的 VLAN 未全部被物理交换机中继时,配置为在关键时刻发送一次电子邮件。 | 在 vSphere Web Client 中启用 vSphere 分布式交换机健康检查(2032878) |
vSphere 分布式交换机 MTU 的状态匹配 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 在 vSphere Web Client 中启用 vSphere 分布式交换机健康检查(2032878) |
vSphere 分布式交换机 MTU 状态受支持 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 在 vSphere Web Client 中启用 vSphere 分布式交换机健康检查(2032878) |
vSphere 分布式交换机组队状态匹配 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 在 vSphere Web Client 中启用 vSphere 分布式交换机健康检查(2032878) |
虚拟机网络适配器保留状态 | 配置为仅在启用网络适配器预留时发送电子邮件。 | 为虚拟机配置带宽分配 |
虚拟机需要合并状态 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 使用快照管理虚拟机 |
主机虚拟闪存资源状态 | VCF for Classic - Automated 实例不支持主机虚拟闪存。 | 无其他信息 |
主机虚拟闪存资源使用情况 | 不在 VCF for Classic - Automated 实例中配置,因为它们不支持主机虚拟闪存。 | 关于虚拟闪存资源 |
在 vSAN 主机上注册或取消注册 VASA 供应商失败 | 不在 VCF for Classic - Automated 实例中配置,因为它们不支持 VASA 存储。 | Broadcom 兼容性指南 |
在主机上注册或取消注册第三方 IO 筛选器存储提供商失败 | 不在 VCF for Classic - Automated 实例中配置,因为它们不支持 VASA 存储。 | Broadcom 兼容性指南 |
服务控制代理程序运行状况警报 | 配置当组件 ID 等于 sca 和新状态等于红色时发送一次电子邮件。 | 如何停止、启动或重新启动 vCenter Server 6.x 服务(2109881) |
身份运行状况警报 | 配置在组件 ID 等于身份且新状态等于红色时发送一次电子邮件。 | 如何停止、启动或重新启动 vCenter Server 6.x 服务(2109881) |
vSphere Web Client 运行状况警报 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 在 VMware vSphere 5.x/6.x/7.x/8.0 网络客户端服务上启用调试日志功能 |
ESX 代理程序管理器运行状况警报 | 配置为当组件 ID 等于 eam 和新状态等于 red 时发送一次电子邮件。 |
如何停止、启动或重新启动 vCenter Server 6.x 服务(2109881) |
消息传递总线配置运行状况警报 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 如何停止、启动或重新启动 vCenter Server 6.x 服务(2109881) |
CIS 许可证运行状况警报 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 如何停止、启动或重新启动 vCenter Server 6.x 服务(2109881) |
清单运行状况警报 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 如何停止、启动或重新启动 vCenter Server 6.x 服务(2109881) |
vCenter Server 运行状况警报 | 配置当组件 ID 等于 vpxd 且新状态等于红色时发送一次电子邮件。 | 如何停止、启动或重新启动 vCenter Server 6.x 服务(2109881) |
数据库运行状况警报 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 如何停止、启动或重新启动 vCenter Server 6.x 服务(2109881) |
数据服务运行状况警报 | 配置为当组件 ID 等于 vmware-dataservices-sca 且新状态等于红色时发送一次电子邮件。 | 如何停止、启动或重新启动 vCenter Server 6.x 服务(2109881) |
RBD 运行状况警报 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 如何停止、启动或重新启动 vCenter Server 6.x 服务(2109881) |
vService Manager 运行状况警报 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 如何停止、启动或重新启动 vCenter Server 6.x 服务(2109881) |
性能图表服务运行状况警报 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 如何停止、启动或重新启动 vCenter Server 6.x 服务(2109881) |
内容库服务运行状况警报 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 如何停止、启动或重新启动 vCenter Server 6.x 服务(2109881) |
传输服务运行状况警报 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 如何停止、启动或重新启动 vCenter Server 6.x 服务(2109881) |
VMware vSphere ESXi 转储收集器运行状况警报 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | VMware ESXi Dump 收集器支持 |
VMware vAPI 端点服务运行状况警报 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 如何停止、启动或重新启动 vCenter Server 6.x 服务(2109881) |
VMware 系统和硬件运行状况管理器服务运行状况警报 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 使用日志排除故障 |
VMware vSphere 概要文件驱动的存储服务运行状况警报 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 如何停止、启动或重新启动 vCenter Server 6.x 服务(2109881) |
VMware vFabric Postgres 服务运行状况警报 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 如何停止、启动或重新启动 vCenter Server 6.x 服务(2109881) |
ESXi 主机证书更新失败状态 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 故障排除 vCenter 服务器和 ESXi 主机证书 |
ESXi 主机证书状态 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 故障排除 vCenter 服务器和 ESXi 主机证书 |
ESXi 主机证书验证失败状态 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 故障排除 vCenter 服务器和 ESXi 主机证书 |
vSphere vCenter 主机证书管理方式 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 故障排除 vCenter 服务器和 ESXi 主机证书 |
根证书状态 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 故障排除 vCenter 服务器和 ESXi 主机证书 |
GPU ECC 未更正内存警报 | 不在 VCF for Classic - Automated 实例中配置,因为它们不支持 GPU。 | 无其他信息 |
GPU ECC 已更正内存警报 | 不在 VCF for Classic - Automated 实例中配置,因为它们不支持 GPU。 | 无其他信息 |
GPU 温度状况警报 | 不在 VCF for Classic - Automated 实例中配置,因为它们不支持 GPU。 | 无其他信息 |
网络连接丢失 | 配置为在 Lost Network Connectivity 或 Lost Network Connectivity to DVPorts 关键事件发生时一次性发送电子邮件。 |
网络故障排除 |
网络上行链路冗余丢失 | 配置为在 Lost Network Redundancy 或 Lost Network Redundancy on DVPorts 关键事件发生时一次性发送电子邮件。 |
网络故障排除 |
网络上行链路冗余已降级* | 配置为在 Network Redundancy Degraded 或 Network Redundancy Degraded on DVPorts 关键事件发生时一次性发送电子邮件。 |
网络故障排除 |
VMkernel NIC 未正确配置* | 配置在 /Migrate/VMknic 中指定的无效 vmknic 关键事件发生时发送一次电子邮件。 |
网络故障排除 |
无法连接到存储器* | 配置为在 Lost Storage Connectivity 、Lost Storage Path Redundancy 、Degraded Storage Path Redundancy 或 Lost connection to NFS server critical events occur 时一次性发送电子邮件。 |
识别 ESX/ESXi 主机上的光纤通道、iSCSI, 和 NFS 存储问题(1003659)g |
迁移错误* | 配置为在 Cannot migrate VM 、Migration error 、Migration host error 、Cannot relocate VM 或 VM orphaned 关键事件发生时一次性发送电子邮件。 |
vMotion 或虚拟机的存储 出现错误:迁移已超过 100 秒的最长切换时间(2141355)vMotion |
退出备用错误 | 不在 VCF for Classic - Automated 实例中配置,因为不建议使用 DPM。 | vSphere分布式电源管理(DPM)可在资源使用率低的时期动态整合工作负载,从而为内部部署节省电力。 将虚拟机迁移到较少的主机上,并关闭不需要的 ESX 主机。 关闭 IBM Cloud 裸机服务器并不能节省能耗。 |
星号 (*) 表示无状态警报。vCenter 不保存无状态警报的数据,也不计算或显示其状态。 无法确认或重置无状态警报。
预配置的警报 - vSAN
- 警报名称 - 在 vCenter 中显示的警报的名称。
- 使用指南 - IBM Cloud for VMware Solutions 本警报器的使用指南。
- 更多信息 - 可从 IBM® 或 VMware 获取更多信息,以帮助解决这些警报触发时的问题。
如果有 vSAN 群集,则适用下表中的其他预配置警报。
警报名称 | 指导信息 | 详细信息 |
---|---|---|
主机闪存容量超过 vSAN 的许可限制 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 无其他信息 |
vSAN 许可证已到期 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 许可故障排除 |
vSAN 主机磁盘上发生错误 | 配置为在 vSAN 磁盘上出现永久错误时发送一次电子邮件。 | 无其他信息 |
vSAN 主机磁盘上发生错误 | 配置为在 Virtual SAN device is under permanent failure 关键事件发生时发送一次电子邮件。 |
无其他信息 |
vSAN 许可证已到期 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 为 vSAN 集群配置许可证设置 |
vSAN 有时间限制的许可证已到期 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 为 vSAN 集群配置许可证设置 |
vSAN 硬件兼容性问题 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 健康检查信息(2114803) |
vSAN 运行状况警报Active multicast connectivity check |
配置为针对关键事件发送一次电子邮件。 | 无其他信息 |
vSAN 运行状况警报Advanced vSAN configuration in sync |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 健康服务 - 群集健康 - 同步高级 配置(2107713)vSAN |
vSAN 运行状况警报After one additional host failure |
配置为针对关键事件发送一次电子邮件。 | 无其他信息 |
vSAN 运行状况警报All hosts contributing stats |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 健康服务 - 性能服务 - 所有主机贡献统计检查(2144400) |
vSAN 运行状况警报All hosts have a vSAN vmknic configured |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 健康服务 - 网络健康 - 所有主机均已配置 vmknic(2108062)vSAN |
vSAN 运行状况警报All hosts have matching multicast settings |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 无其他信息 |
vSAN 运行状况警报All hosts have matching subnets |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 无其他信息 |
vSAN 运行状况警报Basic (unicast) connectivity check (normal ping) |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 健康服务 - 网络健康 - 主机小型 ping 测试(连接性检查)和主机大型 ping 测试(MTU 检查)(2108285) |
vSAN 运行状况警报Cluster health |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 无其他信息 |
vSAN 运行状况警报Component metadata health |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 无其他信息 |
vSAN 运行状况警报Congestion |
配置为针对关键事件发送一次电子邮件。 | vSAN 健康服务 - 磁盘健康 - 拥挤(2109255) |
vSAN 运行状况警报Controller disk group mode is VMware certified |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 健康服务 - HCL Health - HCL 上的 SCSI 控制器(2109871)vSAN vSAN |
vSAN 运行状况警报Controller driver is VMware certified |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 健康服务 - HCL Health - 控制器驱动程序(2109263)vSAN |
vSAN 运行状况警报Controller firmware is VMware certified |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 由 “sas3flash” 供应商工具管理的 2nd (及更多)控制器固件健康检查警告 |
vSAN 运行状况警报Controller is VMware certified for ESXi release |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 健康服务 - HCL Health - 控制器发布支持(2109262)vSAN |
vSAN 运行状况警报CPU AES-NI is disabled on hosts |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 健康服务 - 加密 - CPU AES-NI 主机启用检查(2149499) |
vSAN 运行状况警报Current cluster situation |
配置为针对关键事件发送一次电子邮件。 | vSAN 卫生服务--限额卫生--目前的分组情况(2108740) |
vSAN 运行状况警报Customer Experience Improvement Program (CEIP) |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 健康服务 - 在线健康 - CEIP 检查(2148866) |
vSAN 运行状况警报Data health |
配置为针对关键事件发送一次电子邮件。 | vSAN 健康服务 - 数据健康 - Object Health(2108319)vSAN |
vSAN 运行状况警报Disk capacity |
配置为针对警告事件发送一次电子邮件。 | vSAN 健康服务 - 物理磁盘健康 - 磁盘容量(2108907) |
vSAN 运行状况警报Disk format version |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 健康服务 - 磁盘组 - 磁盘格式版本(2146135) |
vSAN 运行状况警报ESXi vSAN Health service installation |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 无其他信息 |
vSAN 运行状况警报Home object |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 健康服务 - 目标服务 - 家庭对象(2147601)vSAN iSCSI |
vSAN 运行状况警报Host component limit |
配置为针对关键事件发送一次电子邮件。 | vSAN 卫生服务--限额--东道主部分(2146130) |
vSAN 运行状况警报Host issues retrieving hardware info |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 健康服务 - HCL Health - 主机在检索硬件信息时出现问题(2149290) |
vSAN 运行状况警报Host Maintenance Mode and Decommission State |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 主机维护模式与 退役状态同步(51464)vSAN Node |
vSAN 运行状况警报Hosts disconnected from VC |
配置为针对关键事件发送一次电子邮件。 | vSAN 健康服务 - 网络健康 - 主机与 服务器断开连接(2108004)vCenter |
vSAN 运行状况警报Hosts with connectivity issues |
配置为针对关键事件发送一次电子邮件。 | vSAN 健康服务 - 网络健康 - 存在连接问题的主机(2108317) |
vSAN 运行状况警报Invalid preferred fault domain on witness host |
只有当 vSAN 被拉伸时才考虑报警。 | vSAN 健康服务 - 见证主机上的首选故障域无效(2130589) |
vSAN 运行状况警报Invalid unicast agent |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 健康服务 - 单播代理测试无效(2144398) |
vSAN 运行状况警报iSCSI target service |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 健康服务 - 目标服务 - 网络配置(2147602)vSAN iSCSI |
vSAN 运行状况警报Limits health |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 无其他信息 |
vSAN 运行状况警报Memory pools (heaps) |
配置为针对关键事件发送一次电子邮件。 | vSAN 健康服务 - 磁盘健康 - 记忆池(2109256) |
vSAN 运行状况警报Memory pools (slabs) |
配置为针对关键事件发送一次电子邮件。 | vSAN 健康服务 - 磁盘健康 - 记忆池(2109256) |
vSAN 运行状况警报MTU check (ping with large packet size) |
配置为针对关键事件发送一次电子邮件。 | vSAN 健康服务 - 网络健康 - 主机小型 ping 测试(连接性检查)和主机大型 ping 测试(MTU 检查)(2108285) |
vSAN 运行状况警报Multicast assessment based on other checks |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 无其他信息 |
vSAN 运行状况警报Network configuration |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 无其他信息 |
vSAN 运行状况警报Network health |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 无其他信息 |
vSAN 运行状况警报Network latency check |
配置为针对警告事件发送一次电子邮件。 | vSAN 健康服务 - 网络健康 - 网络延迟检查(2149511) |
vSAN 运行状况警报No disk claimed on witness host |
只有当 vSAN 被拉伸时才考虑报警。 | vSAN 健康服务 - 没有在见证主机上申请磁盘(2130584) |
vSAN 运行状况警报Online health connectivity |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 健康服务 - 在线健康 - 互联网连接检查(2149196) |
vSAN 运行状况警报Operation health |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 无其他信息 |
vSAN 运行状况警报Performance Data Collection |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 无其他信息 |
vSAN 运行状况警报Performance service status |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 无其他信息 |
vSAN 运行状况警报Physical disk component limit health |
配置为针对关键事件发送一次电子邮件。 | vSAN 健康服务--物理磁盘--组件限额(2146086) |
vSAN 运行状况警报Physical disk health retrieval issues |
配置为针对关键事件发送一次电子邮件。 | vSAN 健康服务 - 物理磁盘健康 - 物理磁盘健康检索问题(2149291) |
vSAN 运行状况警报Physical disk health - Metadata Health |
配置为针对关键事件发送一次电子邮件。 | 无其他信息 |
vSAN 运行状况警报Preferred fault domain unset |
只有当 vSAN 被拉伸时才考虑报警。 | vSAN 医疗服务 - 首选故障域未设置(2130590) |
vSAN 运行状况警报Resync operations throttling |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 健康服务 - 群集健康 - 重新同步操作节流检查(2149504) |
vSAN 运行状况警报SCSI controller is VMware certified |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 健康服务 - HCL Health - 控制器驱动程序(2109263)vSAN |
vSAN 运行状况警报Service runtime status |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 无其他信息 |
vSAN 运行状况警报Site Latency Health |
只有当 vSAN 被拉伸时才考虑报警。 | vSAN 医疗服务 - 扩展群集 - 站点延迟(2146133) |
vSAN 运行状况警报Software version compatibility |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 卫生服务 - 群 - 软件版本兼容性(2146134) |
vSAN 运行状况警报Space efficiency configuration consistency |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 无其他信息 |
vSAN 运行状况警报Space efficiency usage health |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 无其他信息 |
vSAN 运行状况警报Stats DB object conflicts |
不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | vSAN 健康服务 - 性能服务 - 统计数据库对象冲突检查(2144405) |
vSAN 运行状况警报Stats DB object |
不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | vSAN 健康服务 - 性能服务 - 统计数据库对象检查(2144403) |
vSAN 运行状况警报Stats master election |
不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | vSAN 健康服务 - 性能服务 - 统计总选举检查(2144408) |
vSAN 运行状况警报Stretched cluster health |
不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | 无其他信息 |
vSAN 运行状况警报Time is not synchronized across hosts and VC |
不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | vSAN 健康服务 - 群集健康 - 跨主机和 VC 的时间同步(2149505) |
vSAN 运行状况警报Unexpected number of fault domains |
仅当 vSAN 已延伸时,才视为警报。 | vSAN 健康服务 - 故障域的意外数量(2130581) |
vSAN 运行状况警报Unicast agent configuration inconsistent |
仅当 vSAN 已延伸时,才视为警报。 | vSAN 健康服务 - 单播代理配置不一致(2130580) |
vSAN 运行状况警报Unicast agent not configured |
仅当 vSAN 已延伸时,才视为警报。 | vSAN 健康服务 - 未配置单播代理(2130582) |
vSAN 运行状况警报vCenter or hosts are not connected to Key Management Servers |
仅当启用了 vSAN 加密时,才视为警报。 | vSAN 健康服务--加密--密钥管理服务器连接检查(2149497) |
vSAN 运行状况警报vCenter state is authoritative |
不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | vSAN 健康服务 - 群组健康 - 国家权威(2150916)vCenter |
vSAN 运行状况警报Verbose mode |
不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | 性能服务 - vSAN 健康服务中的 Verbose 模式(51527) |
vSAN 运行状况警报vSAN Build Recommendation Engine build recommendation |
不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | vSAN 健康服务 - 更新管理器 - 建立推荐引擎健康(2150914)vSphere vSAN |
vSAN 运行状况警报vSAN Build Recommendation Engine Health |
不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | vSAN 健康服务 - 更新管理器 - 建立推荐引擎健康(2150914)vSphere vSAN |
vSAN 运行状况警报 vSAN Build Recommendation Engine Health 配置问题 |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 健康服务 - 更新管理器 - 建立推荐引擎健康(2150914)vSphere vSAN |
vSAN 运行状况警报vSAN CLOMD liveness |
配置为针对关键事件发送一次电子邮件。 | vSAN 健康服务 - 群组健康 - CLOMD 有效性检查(2109873) |
vSAN 运行状况警报vSAN cluster configuration consistency |
不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | vSAN 群集一致性(2149506) |
vSAN 运行状况警报vSAN cluster partition |
配置为针对关键事件发送一次电子邮件。 | vSAN 保健服务 - 网络保健 - 群组分区(2108011)vSAN |
vSAN 运行状况警报vSAN disk balance |
配置为针对警告事件发送一次电子邮件。 | vSAN 健康服务 - 群组健康 - 磁盘余额(2144278)vSAN |
vSAN 运行状况警报vSAN HCL DB Auto Update |
不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | vSAN 健康服务 - 硬件兼容性 - HCL DB 自动更新(2146132)vSAN |
vSAN 运行状况警报vSAN HCL DB up-to-date |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查 | vSAN 健康服务 - HCL Health - HCL DB up-to-date(2109870)vSAN vSAN |
vSAN 运行状况警报vSAN HCL health |
不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | 无其他信息 |
vSAN 运行状况警报vSAN Health Service up-to-date |
不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | vSAN 健康服务 - 建设建议 - 发布目录更新(58891)vSAN vSAN |
vSAN 运行状况警报vSAN object health |
配置为针对关键事件发送一次电子邮件。 | vSAN 健康服务 - 数据健康 - Object Health(2108319)vSAN |
vSAN 运行状况警报vSAN Performance Service health |
不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | vSAN 健康服务 - 性能服务 - 状态检查(2149406) |
vSAN 运行状况警报vSAN VM health |
不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | 无其他信息 |
vSAN 运行状况警报vSphere cluster members do not match vSAN cluster members |
不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | vSAN 健康服务 - 群组健康 - 和 群组成员匹配(2149507)vSphere vSAN vSAN |
vSAN 运行状况警报Witness host fault domain misconfigured |
只有当 vSAN 被拉伸时才考虑报警。 | vSAN 健康服务 - 证人主机故障域配置错误(2130586) |
vSAN 运行状况警报Witness host not found |
只有当 vSAN 被拉伸时才考虑报警。 | vSAN 健康服务 - 未找到证人主机(2130585) |
vSAN 运行状况警报Witness host within vCenter cluster |
只有当 vSAN 被拉伸时才考虑报警。 | vSAN 卫生服务 - 群组内的证人主机(2130587)vCenter |
针对 vMotion 的 vSAN 运行状况警报Basic (unicast) connectivity check (normal ping) |
配置为针对关键事件发送一次电子邮件。 | 无其他信息 |
针对 vMotion 的 vSAN 运行状况警报MTU check (ping with large packet size) |
配置为针对关键事件发送一次电子邮件。 | vSAN 健康服务 - 网络健康 - 主机小型 ping 测试(连接性检查)和主机大型 ping 测试(MTU 检查)(2108285) |
vSAN 运行状况服务警报 | 不视为有必要通知。 作为每日主动检查的一部分,会对警报进行审查。 | 无其他信息 |
针对总体运行状况摘要的 vSAN 运行状况服务警报 | 不视为有必要通知。 作为每日主动检查的一部分,对警报进行审查。 | 无其他信息 |
事件和警报过程
下表描述了事件和警报的若干过程。
标题 | 描述 |
---|---|
查看事件 | 要查看事件,请导航至 vCenter,并选择清单对象。 单击“监视器”选项卡、“任务和事件”以及“事件”。 选择事件以查看详细信息。 可以使用过滤器,并选择列标题以对列表进行排序。 |
导出事件 | 您可能需要导出事件,以使用 MS Excel 中的工具来提供帮助。 选择必需的清单对象。 单击监视选项卡,单击事件,然后单击导出图标。 在导出事件窗口中,指定要导出的事件信息的类型。 选择生成 CSV 报告,然后单击保存。 指定文件名和位置并保存文件。 |
事件保留时间 | 缺省情况下,事件保留时间设置为 30 天。 您需要在 VMware vSphere Web Client 中更改此设置。 单击配置选项卡,单击设置,然后单击常规。 单击编辑,将“事件保留时间”更改为所需的天数,然后单击确定。 |
查看触发的警报 | 要查看触发的警报,请导航至 vCenter,然后在警报窗格中选择全部或新。 此列表每 120 秒刷新一次。 要查看所选清单对象上触发的警报,请选择该对象。 单击监视选项卡,单击问题,然后选择触发的警报。 |