帮助文档 Logo
平台使用
阿里云
百度云
移动云
智算服务
教育生态
登录 →
帮助文档 Logo
平台使用 阿里云 百度云 移动云 智算服务 教育生态
登录
  1. 首页
  2. 阿里云
  3. 日志服务
  4. 操作指南
  5. 告警
  6. 设置分组评估

设置分组评估

  • 告警
  • 发布于 2025-04-22
  • 0 次阅读
文档编辑
文档编辑

分组评估是告警监控规则中的一个参数。当告警监控系统对查询和分析结果进行计算时,可基于特定字段进行分组,每个分组单独评估触发条件并触发告警。即您可以使用一条告警监控规则同时监控多个目标,并对每个分组进行独立的告警管理和事务管理。

重要
  • 设置分组评估后,单次评估产生的告警分组最多为100个分组。超过100个分组时,会随机取其中100个发送到告警策略。

  • 选择分组评估字段时,请选择具备标识监控实体特征的字段,字段的值可枚举。请勿选择不具备区分监控实体特征的字段。使用这些字段会产生很多分组,每个分组对应一个告警,造成告警风暴,导致错过重要的告警信息。

    例如:选择Nginx日志中的host、method等字段,OSS访问日志中的bucket字段。请勿选择Nginx日志中的request_time、body_size等字段,错误日志中的err_cnt字段。

示例一:分组监控时序数据

例如您将多个服务器的指标数据存储在一个时序库中,但希望每个服务器的CPU使用率(cpu_util)超过95%时,日志服务可以分开发送每个服务器的告警信息。针对此需求,您可以在创建告警监控规则时设置分组评估。时序数据

具体配置如下:

  • 查询统计:* | select promql_query_range('cpu_util') from metrics limit 1000

    该查询和分析语句用于统计CPU的使用率。

  • 分组评估:标签自动

    时序数据的查询和分析结果支持自动分组。

  • 触发条件:有数据匹配,value > 95,严重度:高

    当查询和分析结果中存在value的值大于95时,触发高级别的告警。

  • 添加标注:配置告警的标题和描述等标注信息,您可以在标注信息中引用字段变量(例如${host})。更多信息,请参见标签和标注。

image

示例二:分组监控日志

例如您在监控OSS访问日志时,希望每分钟发生500错误超过1000次的Bucket可以分开告警。针对此需求,您可以在创建告警监控规则时设置分组评估。

具体配置如下:

  • 查询统计:http_status=500 | select bucket,count(1) as pv group by bucket having pv >1000 order by pv desc

    该查询和分析语句用于统计发生500错误超过1000次的Bucket。

  • 分组评估:标签自定义,bucket

    查询和分析结果将根据bucket进行分组。

  • 触发条件:

    • 条件1:有数据匹配,pv > 3000,严重度:高

      当查询和分析结果中存在pv的值大于3000时,触发高级别的告警。

    • 条件2:有数据,严重度:中

      当查询和分析结果中存在数据时触发中级别的告警。

  • 添加标注:配置告警的标题和描述等标注信息,您可以在标注信息中引用字段变量(例如${pv})。更多信息,请参见标签和标注。

image

相关文章

功能简介 2025-04-22 10:53

本文介绍日志服务告警的主要功能。

应用场景 2025-04-22 10:53

本文介绍日志服务告警功能的应用场景。 开发运维(DevOps) 开发人员通过日志服务告警功能监控产品开发生命周期的各个阶段,及时识别代码

基本概念 2025-04-22 10:52

本文介绍日志服务告警功能的基本概念。

使用限制 2025-04-22 10:52

本文介绍日志服务告警功能的使用限制。

授权 2025-04-22 10:52

本文介绍您在创建告警任务时,涉及到的操作权限和数据访问权限。 告警操作权限 告警操作包括创建、删除、修改、查看告警任务。

授权RAM用户操作告警 2025-04-22 10:52

本文介绍如何为RAM用户授予操作告警权限,并介绍在配置跨Project、地域和阿里云账号监控日志时,如何配置授权。 前提条件 已创建RAM用户。具体操作,请参见创建RAM用户。

目录
Copyright © 2025 your company All Rights Reserved. Powered by 博智数字服务平台.
闽ICP备08105208号-1