IBM Cloud Docs
操作过程概述

操作过程概述

以下信息提供了在 VMware Cloud Foundation for Classic - Automated 实例调配后必须完成的第 2 天操作的视图。IBM Cloud® for VMware Solutions 是一项部署服务,可将 VMware 的软件定义数据中心软件自动部署到 IBM Cloud 上。 以下第0天和第1天的许多任务都由部署自动化完成。

  • 第 0 天
    • 要求
    • 体系结构
    • 设计
  • 第 1 天
    • 安装植入
    • 设置
    • 配置。 有关更多信息,请参阅配置任务

第2天的操作通常包括以下高级任务。

有关第二天职责的更多信息,请参阅 第二天运营职责

操作过程简介

许多 IT 组织会在运行手册中记录其操作过程。 运行手册是一组标准化的文档、参考和过程,用于说明常见的重复执行的 IT 任务。 IT员工参考操作手册,以最佳方式完成工作。 运行手册通过标准化提高了组织效率,可更有效地帮助员工上手。

以下示例是两种典型的运行本:

  • 常规文档,用于捕获过程、指南和任务。 此类文档通常是一般性文档,指的是供应商提供的现有文档。
  • 为企业编写的专用文档。 本文件针对特定系统、应用程序或应用程序套件,不在供应商文档的涵盖范围内。 在记录专用文档时,建议采用以下结构:
    • 概述 - 对服务的概述,包含多个部分,用于描述:
      • 服务是什么?为什么企业需要该服务?
      • 服务的主要联系人是谁?
      • 如何使用服务报告问题?
    • 构建——关注开发团队和服务的主要软件组件,以及服务的构建方式。 包含有关软件产品、OVA 位置、分发介质或源代码位置的信息, 以及打包或分发发行版所需的步骤。 它包括新开发人员入门所需的任何说明。
    • 部署——关注运营团队以及如何部署软件。 它包括硬件和虚拟化基础设施的详细信息,以及如何构建虚拟机(VM),包括 vCPU, 内存和磁盘要求、操作系统版本和配置、要安装的中间件或软件包。
    • 操作流程——常见任务的分步指导,如添加、更改和删除,常见问题及其解决方法,故障排除建议。
    • 故障排除——监控系统发出的常见警报列表,包括针对这些警报的分步操作,以及服务故障排除的一般指导。
    • 灾难恢复计划和过程 - 有关如何在主位置发生灾难时,在其他位置恢复服务的详细信息。
    • 服务级别协议 - 商定的服务参数,例如操作级别协议、关键点指标、可用性目标、恢复点目标和恢复时间目标。

大多数 IT 组织都有多个运行手册作为其参考手册。 本系列文档旨在通过 VCF for Classic - Automated 实例作为贵组织的通用操作手册。 虽然每个运行手册的内容都根据组织的需求而制定,但运行手册的创建方法相当标准,并分为以下两个阶段。

  • 第一个阶段是决定需要记录哪些过程,并在列出这些过程时,为每个过程提供足够的详细信息。
  • 第二个阶段是持续进行的,包括维护、更新和更正这些过程,添加新过程以及引退不再需要的过程。

通过 IBM Cloud for VMware Solutions,您可以利用团队现有的技能、工具集和运行手册来管理 IBM Cloud 中的实例。

以下列表包含最常用的过程、指南和任务:

  • 配置任务 - 这些任务是系统管理员需要执行的常见活动,用于对环境进行定制,以满足企业需求和响应服务请求,例如添加新 VM 和增加容量。 这些任务分组为以下结构:
    • 通用指南
    • VM 过程
    • vCenter 过程
    • vSphere ESXi™主机程序
    • 存储器过程
    • 网络过程
  • 警报—— VMware vSphere® 包含一个事件和警报子系统,用于跟踪 vSphere 环境中发生的事件,并将这些信息提供给 vCenter。 此部分描述了此子系统以及如何在企业中启用和使用警报。
  • 主动日常检查 - 借助这些检查,系统管理员可使环境保持正常运行。 如果每天进行,它可以防止许多与容量和性能相关的常见问题影响您的工作负荷。
  • 故障排除——即使您每天进行主动检查,也会出现影响工作的问题。 因此,您需要尽快解决底层问题。 这些故障诊断指南和一些常见故障诊断场景可帮助系统管理员快速识别并解决这些问题。
  • 合规性 - 合规性指南提供了有关根据监管合规性机制或行业最佳实践来保持环境合规性的一些洞察。 本指南的重点是指导如何强化 VMware 安全性,这其中记录了 VMware 环境最佳实践的多个列表。

上述许多任务是在 Operations Management on IBM Cloud 中自动执行的,而对于不自动执行的任务,系统管理员借助这些工具可以更轻松地手动执行。 必须对 VMware 环境的核心组件进行监控。

在IBM Cloud上的运行管理中,这一点可通过以下章节的描述来实现:

运营管理 IBM Cloud

您可以使用企业工具来监控和管理您的 VCF for Classic - Automated 实例。 表1描述了 VCF for Classic - Automated 实例的核心组件、监控这些组件的原因以及如何使用 IBM Cloud 上的运营管理功能进行监控。 有关更多信息,请参阅参考体系结构文档。

VCF for Classic - Automated实例核心组件
组件 原因 监视工具
vCenter vCenter 是基础架构管理组件,用于管理 vSphere 主机和虚拟化结构(如群集)。vSAN™ 通过 vCenter 进行监控。vSphere 网络(如分布式交换机和端口组)通过 vCenter 进行监控。 VMware Aria® Operations™ Manager 和 VMware SDDC 健康管理包。 VMware Aria Operations™ for Logs从 收集日志数据,Content Pack for 则对日志进行特定分析,并发送警报至 Aria Operations。vCenter vSphere VMware
vSphere 主机 vSphere 主机向计算 VM 提供虚拟化的 CPU、RAM 和网络。 VMware 通过 vCenter 进行 Aria 操作。 VMware Aria Operations for Logs 收集日志数据。
vSAN vSAN 通过合并主机中的存储器以供 VM 使用来提供数据存储。 容量和性能问题会影响在这些虚拟机上运行的应用程序。 VMware Aria Operations 和适用于 vSAN 的管理包提供了更多仪表盘,以帮助监控 vSAN。vCenter vSAN 健康检查通过 VMware Aria Operations 收集。 VMware Aria Operations for Logs 从 vCenter 收集日志数据。
NSX® NSX提供虚拟网络组件,供计算虚拟机使用,网络故障可能会影响这些虚拟机上运行的应用程序。 VMware Aria Operations 和 VMware Aria Operations Management Pack for VMware NSX 可提供网络拓扑的可见性。 VMware Aria Operations for Logs从NSX组件(如控制器、ESG和逻辑交换机)收集日志数据。 VMware Aria Operations™ for Networks 提供深入的网络问题故障排除功能。

Operations Management on IBM Cloud 除了监视外,还提供了有关配置、合规性以及本文档中详细描述的许多主动任务的帮助。