更新时间:2024-04-25 15:11:18
1. 进入告警>告警配置>告警规则页面,点击【+新建】进入新建告警规则页面,各配置项如下所示:
基本配置:
元素名称 元素说明 限制条件
*告警规则名称 设置告警规则名称 ≤32 个字符
标签 设置告警规则的标签标识,输入标签内容后,键入回车键即可添加。

-标签不能超过40个字符;

-不能包含 /:?\"<>|:?‘’“”!《》,#[]{}%&*$^!=.' 特殊字符;

-最多可允许添加 5 个标签

备注 用于对告警规则添加补充说明 -
告警条件:告警条件分为事件告警条件指标告警条件日志告警条件

事件告警:

元素名称 元素说明
*选择事件模型

选择系统内已存事件模型,设置监控对象。可通过“事件模型名称”、“事件类型”进行筛选,点击展开事件模型详情,查看监控的指标以及各指标值对应的事件等级

执行频率

设置事件告警任务的执行周期,可选择固定频率或使用Cron表达式设置执行频率

说明:Cron表达式的最小精度为分钟,24小时制,例如0 0/1 * * *表示从00:00开始,每隔1小时检查一次

指标告警:

元素名称 元素说明 备注
*数据源

设置关键指标的数据来源为已存搜索、自定义搜索内容或指标模型:
若数据源为已存搜索,则选择已存搜索即可;

• 若数据源为自定义搜索,则需选择日志分组、输入搜索语句,与搜索模块的使用方式一致,详细操作请参见 搜索主页 搜索方式 章节;

• 若数据源为指标模型,则选择指标模型即可,可通过“指标模型名称”、“指标类型”、“查询语言”对指标模型进行筛选,快速选择指标模型

-

*计算方式 设置指标值的统计方式:最大值、最小值、平均值、求和、计数、去重计数 当数据源选择指标模型时,基于指标模型计算公式,此处无需配置指标值的计算方式、指标名称
*指标名称

选择需要进行监控告警的指标名称

说明:若统计方式选择计数,则无需选择指标名称,即对数据源内所有指标进行计数统计

*时间窗口

所选时间窗口内的指标会被纳入告警规则计算范围内,时间单位可选择分钟、小时、天,默认为5分钟,即表示任务执行时间前5分钟内的数据会被计算

-

告警分组

选择字段进行告警分组设置,设置告警分组后,系统自动针对每个分组进行告警,提高告警的精确性,若不设置分组告警,则会针对整体指标进行告警。

例如:针对主机的CPU进行告警,设置分组字段为host,而host字段包含h1、h2、h3三个主机,则针对每个主机的CPU都会产生告警

当数据源选择指标模型时,基于指标模型计算公式,此处无需再进行配置

执行频率

设置指标告警任务的执行周期,可选择固定频率或使用Cron表达式设置执行频率

说明:Cron表达式的最小精度为分钟,24小时制,例如0 0/1 * * *表示从00:00开始,每隔1小时检查一次

 -

告警恢复

设置是否在告警的事件恢复至正常后,进行告警恢复记录以及发送告警恢复通知

注意:若此处开启了告警恢复功能,在下方告警阈值配置中需设置“清除”这一阈值范围,否则无法检测到异常事件是否被恢复到正常状态,即告警恢复无法正常生效

告警事件记录为告警恢复的前提是:当前产生的事件为正常(即符合“清除”这一等级)事件,且前一次事件为正常事件

日志告警:

元素名称 元素说明
日志告警类型 设置告警类型为计划告警
*规则模板 允许添加多个规则模板进行组合
*规则模板关系 目前只支持 OR,表示将选择的规则模板通过 OR 进行连接,满足其中一个规则就触发告警
告警阈值(此配置项仅指标告警支持):
元素名称 元素说明
阈值设置

设置紧急/主要/次要/提示/不确定/清除状态下的指标阈值范围,在指标统计值达到阈值范围内将会在告警事件页面记录,到达紧急范围时,将会发起告警通知

注意:若上方告警条件配置中开启了告警恢复功能,此处需设置“清除”这一阈值范围,否则无法检测到异常事件是否被恢复到正常状态,即告警恢复无法正常生效

告警计划:
元素名称 元素说明
告警日期 设置告警规则启用的日期范围
告警时间

设置告警规则在告警日期范围内每天执行的时间段

说明:告警规则会在告警日期范围内的告警时间范围内按执行频率对数据源内的数据进行检查监控并对异常进行告警

告警抑制 用于避免告警风暴,可设置告警抑制,依据告警抑制频率生成告警事件记录:
• 不抑制:表示实时判断或依据执行计划判断,每触发一次告警就生成一条告警记录;
• 开启抑制:默认 10 分钟内只产生一条告警记录;表示 10 分钟内相同触发条件生成的告警事件无论触发多少次告警,仅生成一条告警事件记录

注意:
1. 使用同一签名和同一短信模板 CODE,对同一手机号码发送短信通知,最多支持 50 条/日。因此,为避免短时间内快速消耗单日内的短信发送数,建议告警抑制间隔不低于 10 分钟;
2. 若单日短信通知数量无法满足实际场景需求,请联系阿里云售后人员解除单日发送短信限制,以保证短信通知可正常接收。

触发操作:
用于设置产生告警后的消息通知及转发策略,支持邮件通知、短信通知、微信通知、企业微信通知、钉钉通知、Webhook转发(通用&自定义脚本)、Syslog 转发,每种触发操作最多可支持添加 5 个触发操作任务。事件告警与指标告警、日志告警的通知方式配置略有不同,具体请查看 下文
前提条件:
1. 使用邮件通知方式前,请确认是否已完成邮件服务器配置,详细请参见
邮件服务配置 章节;
2. 使用短信通知方式前,请确认是否已完成短信通通知配置,详细请参见 短信通知配置 章节

3. 使用微信通知方式前,请先完成企业微信服务号与 AnyRobot 系统绑定操作,确保可正常接收告警消息推送,详细请参见 微信服务号系统绑定流程 章节;

4. 使用以上3种告警通知方式前,请确认是否已在
新建用户 中完成被通知用户的邮箱、手机号及微信参数配置。
5. 使用企业微信或钉钉通知方式前,请先完成企业微信/钉钉端的部署以及AnyRobot端的配置,确保可正常接收告警消息推送,详细请参考 告警通知配置 章节。
  •  无:只产生告警记录,不通过任务方式发送或转发告警记录;
  • 邮件、短信、微信通知:通过邮件、短信、微信发送告警通知,支持选择通知用户、通知对象、通知内容、通知语言,各配置项说明如下所示:

元素名称 元素说明 限制条件
*通知用户

• 在下拉列表中选择接收告警通知的用户;

• 将鼠标悬浮至图标上可查看用户是否已绑定邮箱、手机、微信;

• 点击【新建用户】可跳转至新建用户页面创建需要被通知的用户信息,如下所示:

最多允许添加10个通知用户
*通知对象 

当告警条件为指标告警,且数据源为指标模型时,邮件通知支持发送至指标模型中定义的通知对象;或者,当告警条件为事件告警时,邮件通知支持发送至相关事件模型数据源的指标模型中定义的通知对象,可以做到动态地将告警通知发送至相关人员:

• 在下拉列表中选择指标模型维度中表示邮件地址的维度,同时也支持手动输入,如下所示:

说明:“通知用户”及“通知对象”必须至少填写一项,通知邮箱可以是同一个

• 告警条件选择指标告警,且数据源选择指标模型,或者告警条件选择事件告警;

•配置通知对象前,请确认相关指标模型源数据中是否已存在表示邮件地址的数据

*通知模板

• 选择此通知方式使用的通知内容模板

说明:系统提供默认通知模板可供选择,若不合适,可点击右侧【新建】创建自定义通知模板

-

通知语言

设置告警通知内容显示语言:简体中文/English

-

  • 企业微信、钉钉:通过企业微信、钉钉发送告警通知,支持选择通知用户、通知内容、通知语言,各配置项说明如下所示:

元素名称 元素说明
*转发对象

点击【新建转发对象】,选择接收告警通知的人员:

• 支持人员多选;

• 支持点击部门名称以全选部门内所有人员;

• 支持在弹框输入框内输入内容进行搜索

*通知模板

选择此通知方式使用的通知内容模板;

说明:系统提供默认通知模板可供选择,若不合适,可点击右侧【新建】创建自定义通知模板

通知语言

设置告警通知内容显示语言:简体中文/English

  • 通用Webhook转发:支持Webhook(基于HTTP协议将告警信息转发至第三方平台(如:告警监控平台))发送告警消息通知,各配置项说明如下所示:

元素名称 元素说明 限制条件
*转发地址 设置接收转发告警信息的平台地址:IP地址:端口  域名 转发地址必须以 http:// 或 https:// 开头,默认为 http://
请求方法 设置 HTTP 的数据请求方法,包含 POST 、PUT 两种,默认为 POST -
*通知模板

• 选择此通知方式使用的通知内容模板;

说明:系统提供默认通知模板可供选择,若不合适,可点击右侧【新建】创建自定义通知模板

-
转发语言 设置告警转发内容显示语言:简体中文/English -
  •  

完成配置后可点击输入框右上方【验证】进行通用Webhook转发有效性进行验证,也可点击【禁用】或【删除】更改此转发配置的应用状态。

  • 自定义Webhook转发:支持以Webhook自定义脚本(基于HTTP协议将告警信息转发至第三方平台(如:告警监控平台))发送告警消息通知,适合有接口token校验的第三方平台,系统提供Webhook脚本模板,您可在输入框内按需修改脚本,如下所示:

除此之外,其它部分无需修改。完成脚本编辑后可点击输入框右上方【验证】对此脚本的有效性进行验证,也可点击【禁用】或【删除】更改此脚本的应用状态。

  • Syslog 转发:基于 Syslog 协议将告警信息转发至第三方平台(如:告警监控平台),如下所示:

元素名称 元素说明 限制条件
*转发地址 设置接收转发告警信息的第三方平台 IP 地址 -
*转发端口 设置第三方平台接收转发的端口号 端口范围: 0~65535
发送协议 设置数据发送协议,包含 TCP、UDP 两种,默认为 TCP  -
*Severity 表示 Syslog 中产生日志的严重性,包含: Critical 关键、 Error 错误、 Warning 警告、 Informational 信息、 Debug 调试 通过 Severity 和 Facility 的选项组合可确定告警消息是否需要发送至接收 Syslog 的第三方服务平台
*Facility 表示 Syslog 中产生日志的程序模块
*通知模板

• 选择此通知方式使用的通知内容模板;

说明:系统提供默认通知模板可供选择,若不合适,可点击右侧【新建】创建自定义通知模板

-
转发语言 设置告警转发内容显示语言:简体中文/English -

 

完成配置后可点击输入框右上方【验证】进行Syslog转发有效性进行验证,也可点击【禁用】或【删除】更改此转发配置的应用状态。

注意:

1)若“告警条件”配置了事件告警,则可根据不同事件等级设置不同的告警通知方式,即在每种通知方式配置时设置“*事件级别”,选择某种通知方式对应的事件等级,支持多选,即此事件一旦达到此等级就以此种通知方式发送告警,如下所示:

2)若“事件级别”选择了“清除”,即表示当事件恢复正常,用户也可以收到通知,相当于指标告警的“告警恢复”功能。

2. 完成规则参数配置后,点击【保存】完成告警规则创建操作。