使用平台度量
平台度量值是由已启用的监视服务和 IBM Cloud中的平台公开的度量值。
-
平台度量是区域性的。
您可以在服务可用的区域中的 IBM Cloud 上监视已启用的监视服务的度量。
-
您只能配置每个区域的 1 IBM Cloud Monitoring 服务实例,以收集该位置中的 平台度量。
要配置监视实例,必须设置 平台度量 配置设置。
要配置平台度量,必须为您分配 IBM Cloud Monitoring 服务的 IAM 编辑者角色或更高角色。
-
如果已启用区域中的监视实例来收集平台度量值,那么将自动收集已启用的监视服务中的度量值,这些度量值可用于通过此实例进行监视。 有关已启用的监视服务的更多信息,请参阅 云服务。
-
要监视服务实例的平台度量,请检查 IBM Cloud Monitoring 实例是否在要监视的服务实例供应所在的区域中进行供应。
控制哪些数据可视
您可以使用属性对度量进行分段,以便可以定义对用户可见的数据。
以下全局属性可用于分段度量值:
属性 | 属性名称 | 属性描述 |
---|---|---|
Cloud Type |
ibm_ctype |
类型 有效值: public ,dedicated 或 local |
Location |
ibm_location |
受监视资源的位置。 此字段可以设置为区域,数据中心或全局。 |
Scope |
ibm_scope |
度量的作用域。 此字段可以设置为帐户 GUID,组织 GUID 或空间 GUID。 |
Service name |
ibm_service_name |
生成此指标的服务名称。 |
Service instance |
ibm_service_instance |
服务实例 GUID,用于标识与度量相关联的实例。 |
Service instance name |
ibm_service_instance_name |
服务实例名称 该字段提供用户提供的服务实例名称,根据用户提供的名称,该名称不一定是唯一值。 |
Resource group name |
ibm_resource_group_name |
创建服务实例的资源组名称。 |
Resource group ID |
ibm_resource_group_id |
创建服务实例的资源组 GUID。 |
其他属性可用于每个 IBM Cloud 服务。 在 云服务 主题中,确定要监视的服务,然后转至 更多信息 部分。 查找 用于分段的属性 部分,以获取可用于对该服务的度量进行分段的属性列表。
您可以控制在仪表板中每个团队,每个仪表板和每个面板上对分析可见的数据。
仪表板
您可以使用全局属性来设置仪表板的作用域:
- 作用域定义对聚集有效的数据。
- 仅显示作用域中的数据。
- 在仪表板级别设置的作用域将应用于仪表板中的所有面板。
- 您可以覆盖主仪表板作用域并为面板指定特定作用域。
面板
您可以使用全局属性来设置面板的作用域:
- 作用域定义对聚集有效的数据。
- 仅显示作用域中的数据。
团队
您可以使用全局属性来定义可供团队分析的可视数据。
通过仪表板监视平台度量
IBM Cloud Monitoring 提供 1 或更多可用于监视服务的仪表板模板。
-
仪表板模板在监视 UI 的“仪表板 > 仪表板管理器”部分中可用。
-
仅当您具有在该区域中运行的服务实例时,仪表板模板才会显示在监视 UI 中。
-
无法定制仪表板模板。 您可以创建仪表板模板的副本,然后定制该副本以创建仪表板。
创建定制仪表板
要创建定制仪表板,请完成以下步骤:
-
导航至Web UI中的仪表盘部分
-
您可以使用模板或通过手动创建仪表板来创建仪表板。
-
要使用模板创建仪表板:
-
单击 仪表板管理器。
-
单击 仪表板库。
-
单击要用于创建仪表板的模板。
-
单击 复制到我的仪表板。
-
命名仪表板。
-
单击创建并打开
-
-
要创建没有模板的仪表板,请执行以下操作:
-
单击 + 新仪表板。 打开“*新仪表板”*页面。
-
根据需要修改仪表板。
-
单击保存。
-
单击 新建仪表板 以重命名仪表板。 单击复选标记以保存名称更改。
-
-
-
设置仪表板作用域。 单击铅笔图标
。 选择所需的作用域。 缺省情况下,选择了 整个基础架构。
-
选择作用域。
-
单击保存。
-
-
配置面板。 对仪表板中要修改的任何面板重复此步骤。
-
确定要修改的面板。
-
选择编辑面板, 这是 画笔 图标
。
-
如果需要,请更改可视化。
-
更改用于选择数据的查询。
-
对于 数字 和 标尺 图表类型,您可以根据度量阈值设置面板颜色。 单击 阈值。 设置不同阈值的值。
对于 Timechart,设置图表的轴和图注。
-
对于 面板,指定面板的名称和可选描述。
-
更改面板的作用域。 单击铅笔图标
。 然后,更改作用域。 如果需要将仪表板范围还原到面板,请删除自定义范围。 单击应用。
-
单击保存。
-
确定仪表板的范围
完成以下步骤以定义通过仪表板显示的数据的作用域:
-
单击仪表板。
-
在 我的仪表板 部分中选择用于监视 IBM Cloud 服务的定制仪表板。
-
要修改作用域,请单击画笔图标以 编辑仪表板作用域。
-
在下拉框中,输入 ibm 并选择属性。
-
选择运算符。
-
选择 1 个或更多值
您还可以将值留空,然后选择 var 以定义变量,以便用户在通过仪表板分析数据时可以选择 1 或更多值。
-
继续添加更多属性。 定义作用域后,单击 保存。
确定小组的范围
完成以下步骤以定义通过仪表板中的面板显示的数据的作用域:
-
单击仪表板。
-
在 我的仪表板 部分中选择用于监视 IBM Cloud 服务的定制仪表板。
-
选择要在其中更改数据作用域的面板。
-
单击铅笔图标
。
-
缺省情况下,面板将继承仪表板作用域。 要指定定制作用域,必须更改面板的作用域。
-
在下拉框中,输入 ibm 并选择属性。
-
选择运算符。
-
选择 1 个或更多值
您还可以将值留空,然后选择 var 以定义变量,以便用户在通过仪表板分析数据时可以选择 1 或更多值。
-
如果需要,继续添加更多属性。
-
-
要保存作用域,请在面板级别单击 保存。
在平台度量上配置警报
从面板配置警报
完成以下步骤以在度量上定义警报:
-
验证您是否具有用于定义通知方式的通知通道。
您可以在配置警报时启用 1 或更多通知通道。 如果需要多个通知通道,请检查它们是否可用。
-
单击仪表板。
-
在 我的仪表板 部分中选择用于监视 IBM Cloud 服务的定制仪表板。
-
标识要为其定义警报的面板。
在创建警报之前,请检查面板中配置的度量的作用域。 此作用域将自动包含在警报定义中。
-
单击 操作 图标
,然后选择 创建警报。
面板选项 如果在面板中定义了多个查询,那么系统会提示您选择要为其创建警报的度量。
-
选择警报类型。 选项为
Metric
,Change
,Downtime
,Event
或PromQL
。 -
设置以下字段:
警报名称: 输入警报的名称。
警报描述: 添加其他用户可以读取的描述以获取更多上下文。 此字段是可选的。
组: 此警报所属的警报组。 如果未指定,那么警报将属于缺省组。
严重性: 设置警报的严重程度级别。 有效值为
High
、Medium
、Low
和Info
。作用域: 此字段设置为您在面板中为度量定义的作用域。 检查作用域是否是您需要的作用域。
通知: 启用 1 或更多通知通道。
-
根据警报类型,您需要配置将触发警报的内容。
对于
Metric
警报:度量: 此字段设置为从面板中选择的度量。 检查度量值和聚集是否是您需要的度量值和聚集。
阈值: 定义必须求值的条件和阈值。 它还定义警报是发送单个警报还是多个警报。 有效时间范围为
minute
,hour
或day
。 单个警报将触发整个作用域的警报。 如果 1 或更多段同时违反阈值,那么将发送多个警报。 将针对您指定的每个分段发送警报。对于
Change
警报:度量: 此字段设置为从面板中选择的度量。 检查度量值和聚集是否是您需要的度量值和聚集。
阈值: 定义必须求值的条件和阈值。 指示当配置的值在定义的持续时间内 (与先前的持续时间相比) 发生更改时,将发送警报。 还可以在警报评估中配置更改百分比。 例如,如果更改大于 50%。
对于
Downtime
警报:度量: 此字段设置为从面板中选择的度量。 检查度量值和聚集是否是您需要的度量值和聚集。
阈值: 定义必须求值的条件和阈值。 指示当配置的值具有配置的持续时间的停机时间时将发送警报。 还可以根据资源在给定时间段内的停机时间百分比来配置警报。
对于
Event
警报:阈值: 定义必须求值的条件和阈值。 指示当为面板配置的事件数达到,超过或小于特定值时,将发送警报。 阈值还可以考虑时间量。 例如,每分钟超过 50 个事件。
对于
Prometheus/PromQL
警报:阈值: 定义必须求值为 PromQL 查询的条件和阈值。 查询可以考虑持续时间,还可以在自动解决警报之前触发指定时间量的警报。
-
单击“保存” 保存警报。
从“警报”部分配置警报
您可以直接从 警报 部分定义警报。
完成以下步骤以在度量上定义警报:
-
验证您是否具有用于定义通知方式的通知通道。
您可以在配置警报时启用 1 或更多通知通道。 如果需要多个通知通道,请检查它们是否可用。
-
导航至Web UI 中的“警报”部分。
-
单击 新建警报。
-
选择所需的警报类型。
-
选择警报类型。 选项为
Metric
,Change
,Downtime
,Event
或PromQL
。 -
设置以下字段:
警报名称: 输入警报的名称。
警报描述: 添加其他用户可以读取的描述以获取更多上下文。 此字段是可选的。
组: 此警报所属的警报组。 如果未指定,那么警报将属于缺省组。
严重性: 设置警报的严重程度级别。 有效值为
High
、Medium
、Low
和Info
。作用域: 此字段设置为您在面板中为度量定义的作用域。 检查作用域是否是您需要的作用域。
通知: 启用 1 或更多通知通道。
-
根据警报类型,您需要配置将触发警报的内容。
对于
Metric
警报:度量: 此字段设置为从面板中选择的度量。 检查度量值和聚集是否是您需要的度量值和聚集。
阈值: 定义必须求值的条件和阈值。 它还定义警报是发送单个警报还是多个警报。 有效时间范围为
minute
,hour
或day
。 单个警报将触发整个作用域的警报。 如果 1 或更多段同时违反阈值,那么将发送多个警报。 将针对您指定的每个分段发送警报。对于
Change
警报:度量: 此字段设置为从面板中选择的度量。 检查度量值和聚集是否是您需要的度量值和聚集。
阈值: 定义必须求值的条件和阈值。 指示当配置的值在定义的持续时间内 (与先前的持续时间相比) 发生更改时,将发送警报。 还可以在警报评估中配置更改百分比。 例如,如果更改大于 50%。
对于
Downtime
警报:度量: 此字段设置为从面板中选择的度量。 检查度量值和聚集是否是您需要的度量值和聚集。
阈值: 定义必须求值的条件和阈值。 指示当配置的值具有配置的持续时间的停机时间时将发送警报。 还可以根据资源在给定时间段内的停机时间百分比来配置警报。
对于
Event
警报:阈值: 定义必须求值的条件和阈值。 指示当为面板配置的事件数达到,超过或小于特定值时,将发送警报。 阈值还可以考虑时间量。 例如,每分钟超过 50 个事件。
对于
Prometheus/PromQL
警报:阈值: 定义必须求值为 PromQL 查询的条件和阈值。 查询可以考虑持续时间,还可以在自动解决警报之前触发指定时间量的警报。
-
单击“保存” 保存警报。
控制团队对平台度量的访问
您可以控制对作为团队成员的所有用户可见的数据。
-
单击用户图标,然后单击设置。
-
单击 团队。
作为服务的管理员,您可以创建,修改和删除团队。 配置团队时,可以在 团队作用域 部分中定义数据的作用域。
要允许团队查看平台度量,必须选择 平台度量。
启用平台度量将授予对所有平台度量的访问权。 但是,您可以通过配置 1 或更多平台度量值标签来缩小作用域。 请注意,标签的顺序是从列表的开头到结尾应用的。
按实例限制对平台度量的访问
完成以下步骤: