IBM Cloud 中的 Monitoring
您可以使用 IBM Cloud® Monitoring 来监视组织的性能和整体系统运行状况。
您可以从许多平台、协调器和各种应用程序(如Prometheus、JMX、StatsD, Kubernetes 和其他应用程序栈)收集指标,这些平台、协调器和应用程序在IBM Cloud 内、IBM Cloud 外或内部均可使用。 您还可以通过创建定制度量和添加集成来添加更多度量。
请参阅 IBM 支持声明 以了解如何使用代理程序和导出器。
您可以通过 Monitoring Web UI 或其他平台 (例如 Grafana) 来监视度量。
下面显示了在 IBM Cloud Monitoring 上运行的 IBM Cloud 服务的组件概览图:
配置 Monitoring 代理程序时,将自动收集缺省度量的数据。 这些度量值包括可用于在监视度量值时对其进行标签,分段和显示的元数据。 您不需要在主机中进行其他检测或配置,即可获取代理程序自动收集的度量,以深入了解其中发生的情况。
要使用 IBM Cloud® Monitoring 服务监视基础结构,网络和应用程序,可以在受支持的主机上部署 Monitoring 代理程序。 主机确定可以部署的代理程序类型。 代理程序类型确定为该主机自动收集的度量。
要开始收集缺省度量值,必须针对要监视的环境配置 Monitoring 代理程序。
您可以在 IBM Cloud,本地和其他云中监视主机。
源 | 参考 |
---|---|
IBM Cloud 服务 | 启用平台度量 使用平台度量 生成度量的服务 |
Kubernetes 集群 | 监视 Kubernetes 集群 |
Red Hat OpenShift 集群 | 监视 Red Hat OpenShift 集群 |
VPC/VSI | 监视 Linux VPC 服务器实例 |
裸机 | 监视 Linux 裸机服务器 |
Windows 环境 | 监视 Windows 环境 |
Linux 环境 | 使用 Linux 代理程序 在没有公共访问权的 Linux 主机上部署代理程序 |
VMware Solutions | 监视 VMware 共享 |
VMware as a Service | 监视 VMware 即服务 |
VMware 自管理解决方案- vCenter Server with NSX-T 体系结构 | 监视 VMware vCenter Server 部署 |
提供 Monitoring 服务
要开始使用 IBM Cloud中的 IBM Cloud Monitoring 服务,必须在您在 IBM Cloud中操作的每个区域中供应 Monitoring 服务的实例。
您可在资源组的上下文中供应实例。 您使用资源组在 IBM Cloud 中组织您的服务,以便进行访问控制和计费。 您可以在默认资源组或自定义资源组中配置 Monitoring 实例。 有关更多信息,请参阅供应实例。
配置源
供应实例后,必须配置度量值源和/或启用平台度量值。
-
度量源是指任何您想要监控其性能和运行状况的资源。
使用代理程序配置源时,将自动收集缺省度量的数据。
您还可以自定义指标,并为这些指标添加标签,以描述其特性。 另外还会自动收集这些定制度量值的数据。
有关如何配置源以收集缺省度量和定制度量的更多信息,请参阅 收集度量。
例如,您可以配置 Monitoring 代理程序以从 Kubernetes 集群收集度量值。 您可以使用访问密钥配置负责收集指标数据并将其转发到您的实例的代理。 代理部署后,指标的收集和转发到 Monitoring 实例是自动的。 Monitoring 代理程序会自动收集和报告预定义的度量值。 您可以配置环境中要监视的度量值。
-
您可以启用平台度量值以监视 IBM Cloud 服务。 只能配置每个区域的 1 Monitoring 实例以自动收集平台度量值。 了解更多信息。
收集度量值
您可以从IBM Cloud®、IBM Cloud 外部或内部提供的许多平台、协调器和各种应用程序(如Prometheus、JMX、StatsD,、Kubernetes 和其他应用程序栈)收集指标。 您还可以通过创建定制度量和添加集成来添加更多度量。 有关更多信息,请参阅 收集度量。
发送度量值
您可以使用适当的提取功能,通过公共或私有端点发送指标 URL。 可在 端点 部分中找到详细信息。
查看度量值
您可以通过 Monitoring Web UI 监控和管理指标。 有关更多信息,请参阅 查看度量。
请注意,存在显示新时间序列的度量数据的延迟。 在完成新度量源的初始索引之前,数据未就绪。 因此,通过 Monitoring UI,您配置的集群,平台度量或系统等新源都需要一些时间才能显示。
发送通知
您可以配置单个警报和多条件警报,以通知可能需要注意的问题。 触发警报时,可以通过 1 或更多通知通道通知您。 警报定义可以生成多通道通知。
警报是一种通知事件,可用于发出有关需要注意的情境的警告。 每个警报都具有严重性状态。 此状态会通知您所报告信息的重要程度。
例如,您可以设置Monitoring向IBM Cloud Event Notifications发送警报通知。
有关更多信息,请参阅 处理警报和事件。
数据位置
度量数据在 IBM Cloud 上进行托管。
- 每个多专区区域 (MZR) 位置会收集并聚集在该位置运行的每个 IBM Cloud Monitoring 实例的度量值。
- 数据在供应 IBM Cloud Monitoring 实例的区域中进行主机托管。 例如,在美国南部供应的实例的度量值数据在美国南部区域进行托管。
数据收集
Monitoring 代理商数据以10秒为间隔进行收集。
将以 1 分钟的频率收集平台度量发布的数据。
数据保留
将根据累积策略为每个实例保留数据。
随着时间的推移,数据从精细粒度汇总到更粗略的粒度,持续2个月。
累积策略描述随时间变化的数据详细程度:
- 前4小时的数据保留时间为10秒。
- 对于 2 天的数据,以 1 分钟分辨率保留。
- 对于 2 周的数据,以 10 分钟分辨率保留。
- 数据以1小时为分辨率保留2个月。
- 数据以1天为分辨率保留15个月。