操作管理体系结构概述
操作管理层中的产品体系结构通过 IBM Cloud® for VMware Solutions 的日志记录数据提供集中监视。 操作管理层实时监视物理基础架构、虚拟基础架构以及(可选)客户机的计算工作负载。
在高级别,将收集以下信息:
- 拓扑数据,例如物理和虚拟计算、联网和存储对象。
- 监视数据,例如:
- 度量值 - 结构化数据,例如性能和容量
- 日志 - 非结构化数据,例如系统事件
操作管理流程
下图显示了操作管理工具的关键交互和集成。
{: caption="操作工具管理" caption-side="bottom"}
IBM Cloud for VMware Solutions 操作管理包含以下步骤:
-
监控—— VMware Aria® Operations™ Manager使用分析算法跟踪和分析 IBM Cloud for VMware Solutions 架构中多个对象的运行。 这些算法帮助 VMware Aria Operations了解并预测这些对象的行为。 系统管理员可使用视图、报告和仪表板来访问这些信息。
当环境 VMware 中出现问题时,Aria Operations 会生成三种影响类型的警报:
- 运行状况警报 - 指示影响环境运行状况,并需要立即关注的问题。
- 风险警报 - 指示不会立即带来威胁,但需要在不久的将来予以解决的问题。
- 效率警报——用于提高性能或回收资源的信息。
VMware Aria运营警报是指当数据分析表明被监控对象与正常指标值存在偏差,或者被监控组件之一出现问题时,在受监控对象上发生的事件。 VMwareAria Operations 警报被分配到其中一个类别:
- 严重 - 必须立即采取行动。
- 立即 - 必须尽快采取行动。
- 警告 - 必须在时间允许时进行检查。
-
日志 - VMware Aria Operations™ for Logs 提供实时日志管理和日志分析,基于机器学习进行智能分组,高性能搜索,以及跨 IBM Cloud for VMware Solutions 架构中的物理和虚拟对象的故障排除。 VMware Aria Operations for Logs 通过使用
syslog
协议从 vSphere 主机收集数据。 它还为其他 VMware 产品(如 VMware vCenter® )收集事件、任务和警报数据。它与 VMware Aria Operations 集成,可发送通知事件并启用上下文启动。 IBM Cloud for VMware Solutions 架构中可发送syslog
数据的其他对象指向 VMware Aria Operations for Logs。 客户端可以选择配置任何可以发送 syslog 数据的系统,将这些数据转发到 VMware Aria Operations for Logs。 -
网络健康 - VMware适用于网络的 Aria Operations™ 是一款分析工具,专注于主动启用:
- 网络运行状况和性能监视。
- 端到端故障诊断。
- 360 度透视和分析。
- 基于微分段的合规性管理。
-
修补和升级 - vSphere Update Manager (VUM) 为 VMware vSphere 主机和虚拟机 (VM)(非操作系统和应用程序)提供集中的自动补丁和版本管理。
操作管理联网
下图显示了网络概述。
- 供应了工具专用可移植子网,以提供用于初始供应工具 VM 的 IBM Cloud IP 地址空间。 供应之后,由客户负责管理用于横向扩展工具的 IP 地址空间。 此子网上的 VM 需要对在管理子网和内部管理子网上托管的组件的访问权。
- 工具 VXLAN 子网用于提供用于初始供应工具 VM 的 BYOIP IP 地址空间,但在此之后,由客户负责管理用于横向扩展工具的 IP 地址空间。 此子网上的 VM 需要对在覆盖子网上托管的组件的访问权。 ESG 提供 IBM Cloud 和 BYOIP 地址空间之间的 NAT。
- 如果客户希望利用 VMware Aria Operations监控其计算虚拟机,则可以部署 VMware Aria Operations远程收集器。
- VMware Aria Operations for Logs 转发器将日志信息从覆盖组件转发到 VMware Aria Operations for Logs 集群。 如果需要,客户还可以配置其计算虚拟机以使用这些转发器。
- VMware Update Manager (VUM) 提供对 vSphere 主机和 VM 硬件及工具的更新。 VUM 使用代理来获取对因特网存储库的访问权。
VMware Aria Operations 从环境中的对象收集数据。 收集的每条数据都称为度量值观察或值。 VMware Aria Operations使用 适配器从 收集原始指标。vCenter vCenter 除了收集指标外,VMware Aria Operations 还计算容量指标、徽章指标以及用于监控系统运行状况的指标。 警报定义是症状和建议的组合,用于识别问题区域并生成警报,您可根据警报对这些区域采取行动。
受监视组件
监视 vCenter
vCenter 的监控由 VMware Aria Operations和 VMware SDDC Health Management Pack完成。 VMware Aria Operations for Logs从 收集日志数据,Content Pack for 对日志进行特定分析,并发送警报至 Aria Operations。vCenter vSphere VMware
VMware SDDC健康管理包可监控SDDC管理堆栈,并提供与SDDC产品组件(包括 vCenter )的配置和合规性相关的健康和警报徽章。
监视 vSphere 主机
对 vSphere 主机的监控是通过 VMware Aria Operations 通过 vCenter 完成的,而日志的收集则是通过 VMware Aria Operations for Logs 完成的。
监视 vSAN
要监控 vSAN, VMware Aria 操作,需要使用 VMware Aria 日志操作。 在 vCenter, 可以使用一组额外的 vSAN 健康检查。 安装 Management Pack for vSAN 可提供更多仪表板来帮助监视 vSAN。
VMware 如果存储区域网络中SDDC产品组件出现问题,Aria Operations会发出警报,适配器正在监控该区域。VMware vSAN 与配置合规性和健康相关的警报通过 VMware SDDC 健康解决方案管理包从 VMware vSAN 管理包传递。vSAN 通过 VMware Aria Operations vSAN 管理包通过 vCentre 设备使用 vSAN 适配器进行监控。 缺省收集时间间隔为 5 分钟,并且 vSAN 适配器还会从 vSphere 对象中收集运行状况检查服务和性能服务度量值。 运行状况检查服务时间间隔在 vSphere 界面中进行配置,缺省情况下为 60 分钟。
要确保 vSAN 适配器可以收集所有性能数据,必须在 vSphere 中启用 vSAN 性能服务。
监视 NSX for vSphere
为了监视 NSX,实现了以下工具:
- VMware Aria运营经理
- VMware Aria Operations for Logs
- VMware 网络运营Aria
这使系统管理员能够对 VMware NSX 进行监视、管理和故障诊断。 VMware Aria Operations Management Pack for VMware NSX 可提供网络拓扑的可视性。 通过 NSX 仪表板,可快速了解 NSX 环境及其组件运行状况的概况。 NSX对象与 vSphere 对象之间的关联性使故障排除更加容易。
VMware Aria Operations使用管理包轮询 NSX,以获取配置、性能和支持数据。VMware 管理包代表 VMware Aria Operations将轮询请求转换为REST API调用,以便从NSX Manager中检索所需数据。
NSX组件需要配置为将系统日志发送至 VMware Aria Operations for Logs。 更多信息,请参阅 为 NSX 节点添加 Syslog 服务器。
此外,您必须为启用防火墙的每个集群配置远程系统日志服务器。 远程 syslog 服务器在 Syslog.global.logHost
属性中指定。
NSX 流监视可以在 NSX Manager 中使用,以确定哪些流已核准,哪些流被阻止。 如果需要,可以为 vSphere 分布式交换机配置端口镜像。
监视 NSX-T
为了监控NSX-T™,我们使用了以下工具:
- VMware Aria运营经理
- VMware Aria Operations for Logs
VMware SDDC Health Management Pack 监视以下组件:
- 逻辑开关——监控逻辑开关的状态。
- 控制器集群——监控已部署的集群节点数量,确保高可用性并保持法定人数。
- 控制器节点 - 监视与控制器集群和管理器节点的节点连接。
- Edge 节点 - 监视处于“正在运行”状态的 Edge 节点及其与控制器集群和管理器节点的连接。
- NSX-T 管理服务。
- T0 路由器服务 - 监视静态路由、NAT、BGP、BFD 和路径重新分发服务。
- T1 路由器服务 - 监视静态路由、NAT 和路径公布服务。
监控 VMware Aria Operations Manager
VMware SDDC Health Management Pack 具有针对以下事件的警报定义:
- 当前 VMware Aria Operations Manager节点的规模不足以应对给定的负载。
- 集群节点配置不符合 VMware Aria Operations Manager的规模准则。
- 对于给定负载,远程收集器的当前大小设置不足。
- 远程收集器配置不遵循 VMware Aria Operations Manager的规模准则。
- VMware Aria Operations Cluster 已超出建议的分析节点数量。
监控 VMware Aria 操作日志
VMware Aria Operations for Logs支持触发健康状况通知的警报,并在发生重要系统事件时生成通知,例如磁盘空间即将耗尽时,Aria Operations for Logs必须开始删除或归档旧的日志文件。VMware
系统需求
此设计使用的设备数量和大小如下:
VMware Aria运营 | VMware Aria Operations for Logs | VMware 网络运营Aria | 代理 | |
---|---|---|---|---|
VM 数量 | 4 | 4 | 1+1 | 1 |
vCPU | 8 | 8 | 4 + 8 | 4 |
RAM (GB) | 32 | 16 | 12 + 32 | 0.5 |
磁盘 (GB) | 254 | 1,042 | 158 + 1000 | 80 |
软件版本
产品名称 | 版本 |
---|---|
VMware Aria 运营经理 高级或更高级别 | 7.0 |
VMware Aria Operations Management Pack for NSX for vSphere | 3.5.2 |
VMware Aria 存储设备运营管理包 | 7.0.0 |
VMware Aria Operations Management Pack for Site Recovery Manager | 8.1.1 |
VMware Aria Operations for Logs | 4.7 |
VMware Aria Operations for Logs Content Pack for NSX for vSphere | 3.8 |