监测指标 Continuous Delivery
IBM Cloud® Monitoring 是一种第三方云本机和容器智能管理系统,您可以将其包含在 IBM Cloud 体系结构中。 使用此系统可了解应用程序、服务和平台的性能和运行状况。 它为管理员、DevOps 团队和开发人员提供具有用于监视和故障诊断、定义警报以及设计定制仪表板的高级功能的完整堆栈遥测。
平台度量概述
每个区域只能配置一个 IBM Cloud Monitoring 服务实例以收集平台度量值。
- 要配置 Monitoring 实例,必须设置平台度量值配置。
- 如果已启用区域中的监视实例以收集平台度量值,那么将自动收集已启用的监视服务中的度量值,并可通过此实例进行监视。
- 在启用帐户和区域中的监视实例以收集平台度量之后,它会自动从同一帐户和区域中的所有 Continuous Delivery 服务实例收集度量。 您不需要选择性加入 Continuous Delivery 服务度量值集合。 您也不能选择退出 Continuous Delivery 服务度量值集合。
要监视平台度量,请检查是否在供应了 Continuous Delivery 实例的同一区域中供应了 IBM Cloud Monitoring 实例。
从 Continuous Delivery 仪表板启用平台度量
完成以下步骤配置平台指标:
-
登录到 IBM Cloud。
-
单击资源列表。
-
在 服务和软件 部分中,单击您计划监视的 Continuous Delivery 实例。
-
从“管理”页面,单击 操作 > 添加监视 以在 Continuous Delivery 实例的区域中配置 平台度量。
如果菜单选项包含 监视 选项,那么已针对平台度量配置包含 Continuous Delivery 实例的帐户和区域。
-
供应 IBM Cloud Monitoring 服务的实例。
供应“监视”实例后,将打开“可观察性”页面。 要继续使用 Continuous Delivery,请返回到 Continuous Delivery UI。
直到您 设置 Tekton 管道,配置至少一个 专用工作程序 池,并触发某些 Tekton 管道触发器 以生成队列时间度量之后,度量才可视。
查看度量值
要监视 Continuous Delivery 度量,必须在 Continuous Delivery 实例可用的区域中启动针对平台度量启用的监视 Web UI 实例。
有不同的选项可用于启动监视 Web UI 和监视度量值:
从 Continuous Delivery 仪表板启动监视 Web UI
完成以下步骤以从 Continuous Delivery 仪表板启动监视 Web UI:
-
登录到 IBM Cloud。
-
单击资源列表。
-
在 服务和软件 部分中,单击您计划监视的 Continuous Delivery 实例。
-
从“管理”页面,单击 操作 > 监视 以在 Continuous Delivery 实例的上下文中查看 Continuous Delivery 仪表板。
从“可观察性”页面启动“监视”Web UI
完成以下步骤以从 可观察性 页面启动“监视”Web UI:
- 登录到 IBM Cloud。
- 启动监视 UI。
- 单击 可观察性,然后选择 监视。
- 从 IBM Cloud上可用的实例列表中,选择要监视的 Continuous Delivery 实例。 然后,单击 打开仪表板。
要监视 Continuous Delivery 实例,请更改作用域或生成缺省仪表板的副本。
监视 Continuous Delivery
监视 Continuous Delivery 服务的实例时,请考虑以下任务:
任务 | 预定义警报 | 要查找的内容 |
---|---|---|
监视交付管道运行在开始在专用管道工作程序池上执行之前保持排队的时间长度。 | Continuous Delivery 管道排队时间 | 如果队列时间重复超过 10 秒,那么专用工作程序池可能没有足够的容量来处理所请求的管道运行。 您可能需要扩展工作程序池,创建新的工作程序池或减少管道运行次数。 |
监视交付管道队列时间
描述
管道队列时间将跟踪 Continuous Delivery 服务接收并排队运行管道的请求与专用工作程序池取消排队并开始执行管道之间的耗用时间 (以秒计)。 理想情况下,管道请求在被专用工作程序池选取之前仅花费一秒或两秒时间在队列上。 如果管道请求保持排队数秒或几分钟,那么专用工作程序池可能缺少处理传入管道工作负载的容量。 当管道队列时间超过合理阈值 (例如 10 秒) 时发出警报,可以帮助您关注需要扩展的专用工作程序池。
用户操作
“监视”中的 Continuous Delivery 仪表板可帮助确定管道排队时间的趋势。 如果专用工作程序池所服务的管道的排队时间持续数秒或呈上升趋势,请检查专用工作程序池的配置,包括池中节点的数量和处理容量。 您可以通过扩展专用工作程序池或降低分派到专用工作程序池的管道作业和任务的频率,种类或复杂性来缩短队列时间。
Continuous Delivery 预定义仪表板
下表概述了可用于监视 Continuous Delivery 度量的预定义仪表板:
仪表板名称 | 描述 |
---|---|
Continuous Delivery |
从服务实例 UI 启动监视 Web UI 时的缺省仪表板。 |
无法更改“缺省”仪表板。 要定制仪表板,可以创建其副本。
按服务套餐提供的度量值
度量值名称 | Lite | Professional |
---|---|---|
管道排队时间 | ||
管道运行持续时间 |
预定义警报
下表概述了“监视”中可用的预定义警报:
警报名称 | 描述 |
---|---|
Continuous Delivery 管道排队时间较长 | 使用此警报来监视管道请求的排队时间,以让您知道专用工作程序池处理请求的时间是否过长。 |
Continuous Delivery 度量值字典
管道排队时间
Continuous Delivery 服务接收并排队运行管道的请求与专用工作程序池取消排队并开始执行管道之间的耗用时间 (以秒为单位)。
元数据 | 描述 |
---|---|
Metric Name |
ibm_toolchain_pipeline_queue_time_seconds |
Metric Type |
gauge |
Value Type |
second |
Segment By |
Service instance, Service instance name, Private worker pool ID |
管道运行持续时间
从管道运行开始在 Worker 上执行到所有任务完成所用的时间(秒),表示管道的总运行时间。
元数据 | 描述 |
---|---|
Metric Name |
ibm_toolchain_pipeline_run_duration_seconds |
Metric Type |
gauge |
Value Type |
second |
Segment By |
Pipeline ID and Trigger name |
分段的属性
全局属性
以下属性可用于细分本主题中列出的所有指标。
属性 | 属性名称 | 属性描述 | 有效值 |
---|---|---|---|
Cloud Type |
ibm_ctype |
云类型 | 有效值为 public 或 local 。 |
Location |
ibm_location |
受监视资源的位置。 | 您可以指定区域,数据中心或 global 。 |
Resource group |
ibm_resource_group_name |
与服务实例关联的资源组。 | 从帐户中可用的资源组中选择一个资源组。 |
Scope |
ibm_scope |
所考虑的数据样本的范围。 | 您可以选择与此度量相关联的帐户,组织或空间 GUID 作为作用域。 |
Service name |
ibm_service_name |
生成此指标的服务名称。 | toolchain |
其他属性
以下属性可用于细分一个或多个全局属性:
请检查每个单独的度量值以获取受支持的分段选项。
属性 | 属性名称 | 属性描述 |
---|---|---|
Private worker pool |
ibm_toolchain_pipeline_worker_pool |
Continuous Delivery 管道专用工作程序池的唯一标识。 |