监视 Red Hat OpenShift 集群
使用本教程了解如何配置 Red Hat® OpenShift® 群集,以便将度量指标转发到 IBM Cloud® Monitoring 服务。 您可以监视 IBM Cloud,内部部署和其他云中的集群。
要配置群集转发指标,必须在 Red Hat OpenShift 群集的每个工作节点上安装监控代理,方法是使用 DaemonSet. 监控代理使用访问密钥(令牌)来验证 IBM Cloud Monitoring 实例。 监控代理充当数据收集器。 它会自动收集度量值,例如工作程序节点 CPU 和工作程序节点内存使用情况、 进出容器的 HTTP 流量以及若干基础架构组件的相关数据。 此外,该代理程序还可以使用兼容 Prometheus 的提取器或 StatsD 外观来收集定制的应用程序度量值。

例如,要配置 Red Hat OpenShift 集群以将度量值转发到 IBM Cloud Monitoring 实例,可以使用 Helm 或脚本来部署代理程序:
Monitoring 代理程序自动收集每个主机的以下类型的系统度量值:
-
System hosts metrics
提供有关 CPU,内存和存储器使用情况度量的信息,可用于分析所有进程的性能和资源利用率。 -
File and File System metrics
提供有关可用于分析系统中发生的文件交互的文件和文件系统的信息。 例如,您可以找到有关打开的文件,进出的字节数或给定文件系统的使用百分比的信息。 -
Process metrics
提供有关在服务器中运行的进程的信息。 例如,您可以使用这些度量值来浏览进程数,或者获取客户机或服务器信息。 -
Network metrics
提供有关网络的信息。 它们提供对应用程序,容器和服务器之间建立的连接的洞察。 例如,您可以查看发送或接收的字节数,或 HTTP 请求、连接和延迟的数量。 此外,对于SQL或 MongoDB,,当配置为故障排除模式时,代理会收集其他信息。
Monitoring 代理程序针对每个 Red Hat OpenShift 集群自动收集以下类型的度量值:
-
State metrics
:Kub 状态度量值报告在 Red Hat OpenShift 组件 (例如,部署,节点和 pod) 中运行的各种对象的运行状况和状态。 要查看缺省情况下收集的度量列表,请参阅 Red Hat OpenShift 状态。 -
Resource usage metrics
: 资源使用情况度量值报告集群中运行的工作程序 (节点) 和 pod 的 CPU 和内存的运行状况和状态。 可以按命名空间、按 Worker、按 pod、按工作负载对象(如部署、daemonSets,)分析数据。
有关收集的度量的列表,请参阅 可用于编排环境的度量。
通过 Monitoring UI,您可以在 顾问程序 选项卡,探索 选项卡和 仪表板 选项卡中分析数据。 您可通过度量值视图和仪表板来监视数据。
在监控数据时,请考虑以下信息:
-
在 资源管理器 选项卡中,可以监视各个度量。
-
在 顾问程序 选项卡中,可以监视 Red Hat OpenShift 或主机级别度量。
此选项卡仅适用于属于有权监视 Red Hat OpenShift 或主机级别度量的团队的用户。
-
在 仪表板 选项卡中,您可以通过面板预定义仪表板或定制仪表板进行监视,并获取对网络数据,应用程序数据,拓扑,服务,主机和容器的专门洞察。 在仪表板中,面板显示一个度量值或一组度量值。
对于每个度量值视图和仪表板,可以定义数据作用域、数据聚集方式以及要应用于数据的时间和组过滤器。 有关更多信息,请参阅 管理面板。
您可以将仪表板配置为团队的默认入口点,从而统一团队的体验,并让用户立即关注与他们最相关的信息。
有关更多信息,请参阅 查看度量。
目标
在本教程中,您将为 Red Hat OpenShift on IBM Cloud 集群配置度量值。 尤其是:
- 供应 IBM Cloud Monitoring 实例。
- 在集群中配置监视代理程序以发送度量值。
- 使用监控用户界面分析群集指标。
准备工作
-
阅读有关 Monitoring 的信息。
-
使用作为 IBM Cloud 帐户的成员或所有者的用户标识。 要获取 IBM Cloud 用户标识,请转至: 注册。
-
-
IBM Cloud CLI (
ibmcloud
) -
IBM Cloud Kubernetes Service 插件 (
ibmcloud ks
) -
IBM Cloud Container Registry 插件 (
ibmcloud cr
) -
IBM Cloud Kubernetes Service 可观察性插件 (
ibmcloud ob
)
-
-
创建集群或使用现有的 Red Hat OpenShift on IBM Cloud 集群。
-
确保您的用户标识分配有以下 IBM Cloud® Identity and Access Management 策略:
资源 | 访问策略的作用域 | 角色 | 区域 | 信息 |
---|---|---|---|---|
资源组 Default | 资源组 | 查看者 | us-south | 要允许用户查看 Default 资源组中的服务实例,此策略是必需的。 |
IBM Cloud Monitoring 服务 | 资源组 | 编辑者 | us-south | 要允许用户在 Default 资源组中供应和管理 IBM Cloud Monitoring 服务,此策略是必需的。 |
Red Hat OpenShift 集群实例 | 资源 | 编辑者 | us-south | 在 Red Hat OpenShift on IBM Cloud 集群中配置秘密和监控代理时需要使用该策略。 |
有关 IBM Cloud® Kubernetes Service IAM角色的更多信息,请参阅 IAM角色和操作。
步骤 1. 供应 IBM Cloud Monitoring 实例
在本入门教程中,将说明如何在 us-south
区域提供 IBM Cloud Monitoring 实例。 有关支持的区域的更多信息,请参阅
区域。
要配置 IBM Cloud Monitoring 的实例,请完成以下步骤:
-
使用用户标识和密码登录后,IBM Cloud UI 即会打开。
-
单击目录。 这将打开 IBM Cloud 中提供的服务的列表。
-
要过滤显示的服务列表,请选择日志记录和监控类别。
-
单击 IBM Cloud Monitoring 磁贴。
-
选择位置和服务套餐。
缺省情况下,已设置轻量套餐。
有关其他服务套餐的更多信息,请参阅价格套餐。
-
配置资源。
输入服务实例的名称。
选择资源组。
(可选) 添加标记。
-
单击创建。
供应实例后,可观察性仪表板将打开并显示监视实例的详细信息。
要通过 CLI 供应实例,请参阅通过 IBM Cloud CLI 供应实例。
步骤 2. 配置 Red Hat OpenShift on IBM Cloud 集群,将指标发送至实例
要配置 Red Hat OpenShift on IBM Cloud 群集将指标发送到 IBM Cloud Monitoring 实例,必须在群集的每个节点上安装监控代理 pod。 监控代理通过 DaemonSet 安装,可确保每个工作节点上都运行一个代理实例。 监控代理会从安装它的 pod 收集指标,并将数据转发到你的实例。
为了提供全套系统指标,监控代理需要有特权状态。
要配置 Red Hat OpenShift on IBM Cloud 群集将指标转发到 IBM Cloud Monitoring 实例,请从命令行完成以下步骤。
设置集群上下文并登录到集群
完成以下步骤:
-
打开终端以登录到 IBM Cloud。
ibmcloud login -a cloud.ibm.com
选择已供应 IBM Cloud Monitoring 实例的帐户。
-
列出集群以了解在其中集群可用的区域和资源组。
ibmcloud oc clusters
-
设置资源组和区域。
ibmcloud target -g RESOURCE_GROUP -r REGION
位置
RESOURCE_GROUP
是在其中集群可用的资源组的名称,例如default
。REGION
是在其中集群可用的区域,例如us-south
。 -
在会话中设置集群上下文。
ibmcloud oc cluster config --cluster <cluster_name_or_ID>
-
登录集群。 选择登录到 OpenShift 集群的方法。 了解有关登录方法的更多信息。
在群集中安装 IBM Cloud Monitoring 代理
-
对公共或专用端点运行以下命令。
专用端点
curl -sL https://ibm.biz/install-sysdig-k8s-agent | bash -s -- -a <MONITORING_ACCESS_KEY> -c ingest.private.<REGION>.monitoring.cloud.ibm.com -ac 'sysdig_capture_enabled: false' --openshift
公共端点
curl -sL https://ibm.biz/install-sysdig-k8s-agent | bash -s -- -a <MONITORING_ACCESS_KEY> -c ingest.<REGION>.monitoring.cloud.ibm.com -ac 'sysdig_capture_enabled: false' --openshift
其中,
<MONITORING_ACCESS_KEY>
是实例的摄入密钥,<REGION>
是 IBM Cloud Monitoring 实例的区域。缺省情况下,已安装 slim 代理程序。 纤薄的代理程序降低了潜在漏洞的攻击可能性,因此更安全。 如果需要安装完整代理程序,请将
-af
选项添加到curl
命令。 -
验证监控代理是否创建成功及其状态。 运行以下命令:
oc get pods -n ibm-observe
当您看到一个或多个
sysdig-agent
pod 时,表明部署成功完成。sysdig-agent
pod 的数量与集群中工作程序节点的数量相同。 所有 pod 都必须处于Running
状态。
步骤 3. 启动监视 UI
要通过 IBM Cloud 控制台启动监控用户界面,请完成以下步骤。
-
使用用户标识和密码登录后,IBM Cloud“仪表板”即会打开。
-
从菜单
中,选择 可观察性。
-
选择监视。 这将显示 IBM Cloud 上可用的实例的列表。
-
找到实例,然后单击 打开仪表板。 这将打开 Web UI。
在监视代理程序初始收集和处理信息时,可能需要一些时间才能看到集群条目。
每个浏览器只能监视一个实例。 对于同一实例,可以有多个选项卡。
步骤 4. 监视集群
在 顾问程序 选项卡中,您可以对主机以及 Kubernetes 和 Red Hat OpenShift 集群的运行状况,风险和容量进行监视和故障诊断。

- 每 10 分钟刷新一次数据。
- 度量按事件计数和严重性划分优先级。
- 有关更多信息,请参阅 Advisor。
在 顾问程序 部分中,可以选择按集群,按节点,按名称空间或按工作负载监视 Red Hat OpenShift 集群。 每个选项都提供了一组预定义仪表板,可用于监视资源的运行状况。 您还可以选择按主机进行监视。
按集群监视 Red Hat OpenShift 集群
当您选择按集群监视集群时,可以选择更多过滤器以按节点或名称空间显示数据,也可以选择以下任何仪表板:
- 工作负载状态和性能
- Node 状态和性能
- Pod Right浆料和工作负载容量优化
- 集群容量规划
- 集群/名称空间可用资源
- 集群概述
- CPU 分配优化
- 内存分配优化

有关如何解释此视图的更多信息,请参阅 关于集群概述。
按节点监视集群
选择按节点监视集群时,可以选择以下任何仪表板:
- Node 状态和性能
- Pod 调度故障诊断
- Node 概述
- CPU 分配优化
- 内存分配优化
有关如何解释此视图的更多信息,请参阅 关于节点概述。
按名称空间监视集群
选择按名称空间监视集群时,可以选择更多过滤器以按工作负载显示数据,也可以选择以下任何仪表板:
- 工作负载状态和性能
- Pod 状态和性能
- Pod Right浆料和工作负载容量优化
- 名称空间概述
- 工作负载 CPU 使用率和分配
- 工作负载内存使用情况和分配
有关如何解释此视图的更多信息,请参阅 关于名称空间概述。
按工作负载监视集群
选择按工作负载监视集群时,可以选择以下任何仪表板:
- 容器资源使用情况和故障诊断
- Pod 状态和性能
- Pod Right浆料和工作负载容量优化
- 工作负载状态和性能
- 部署概览
- Pod 概述
- 工作负载 CPU 使用率和分配
- 工作负载内存使用情况和分配
有关如何解释此视图的更多信息,请参阅 关于工作负载概述。
后续步骤
-
创建定制仪表板。 有关更多信息,请参阅使用仪表板。
-
了解警报。 有关更多信息,请参阅使用警报。
-
了解如何管理集群中的日志。 请参阅 IBM Cloud Logs 入门指南。
-
了解 IBM Cloud Monitoring Workload Protection 功能,以查找软件漏洞并划分优先级,检测和响应威胁,以及管理从源到运行的配置,许可权和合规性。 请参阅 IBM Cloud® Security and Compliance Center Workload Protection。