更新时间:2023-02-08 13:53:25
在服务健康度分析模块中,服务表示真实IT运行环境中的服务,如虚拟机、Web网页服务、数据库等。您可在服务配置模块中新建基础设施服务,进而在服务分析器模块对此服务质量、服务运行的健康状态进行可视化监控。
1. 配置服务的SLI目标项
进入服务健康度分析>配置>服务配置页面,点击SLO配置区域的【新建目标】,设置SLI在指定时间窗口内的期望目标值,通过配置错误预算阈值设置服务质量风险监控区间以及SLI的计算方式(下文以“基于服务可用性”为例进行示意):
2. 配置依赖实体
依赖配置区域点击【依赖实体】,设置日志分组(anyrobot_slo_vm)、拆分字段(system.user.host),自定义实体显示名称(system.user.hostname),点击【预览】可在页面右侧查看已配置的依赖实体,如下所示:
配置完成后,可将匹配到的多个实体与当前服务关联,在服务分析器模块对服务质量进行更细粒度地监控。
3. 配置服务KPI
点击 KPI 配置区域的【新建KPI】进入KPI配置页面,服务及实体的KPI值基于此处配置的规则计算得出。下文以配置数字化线系统状态的KPI为例,进行说明:
注意:实体KPI计算规则用于计算实体KPI(具体指符合 配置依赖实体 中的筛选规则的实体),若当前服务无实体依赖,AnyRobot将此服务视为单实体,实体KPI=当前服务依赖的KPI的聚合结果,服务KPI值及对应的服务健康分数将由实体KPI及实体健康分数分别聚合得到
• 配置 KPI 名称:数字化线;
• 数据来源:可根据实际配置选择已存搜索、自定义搜索语句或应用 KPI 计算模板,明确 KPI 聚合数据来源;
• 阈值字段:配置需监控和计算的阈值字段,如:system.status;
• 配置实体级 KPI 计算方式:基于不可用性;
• 配置实体KPI计算的阈值条件:=0;
• 配置服务级 KPI 聚合方式:平均值;
• 填充数据间隙:可根据实际需求填写填充缺失数据的字段;
• 单位:状态;
• 计算时间区间及频率:可根据实际需求进行选择;
• 阈值类型:可根据实际需求进行阈值设置(如:min-0.8,KPI严重性等级为“严重”;0.8-max,KPI严重性等级为“正常”)
点击【完成】即可完成上述配置。进入KPI列表页面可查看或编辑已创建的KPI参数,如下所示:

4. 定义服务可用性
服务可用性配置区域可设置服务依赖的KPI及依赖服务的重要程度、定义服务KPI/服务健康分数对应的服务严重性等级,进而系统将基于以上指标评估服务是否可用。配置过程主要涉及以下3个方面:
• 服务依赖对象:服务依赖对象包括服务依赖KPI及服务依赖的服务,依赖对象的状态变化将波及到服务的运行状况及服务健康分数。
• 依赖对象重要性权重设置:依赖对象对于服务的重要性越高,需设置较高占比的权重,以表示此KPI/服务对服务波及的影响越大;当此对象为关键依赖时,此KPI/服务可直接影响服务的可用性,即当关键依赖不可用时,该服务不可用。
• 服务严重性等级阈值设置:此阈值为服务KPI/服务健康分数与服务严重性等级的匹配区间。当服务健康分数处于“正常”或“警告”等级时,服务可用;当服务健康分数处于“严重”等级时,服务不可用。
您可依据服务的实际业务场景,完成服务可用性各评估指标的定义,配置参考如下:
 说明:由于本示例中不涉及服务依赖项设置,故未进行演示。上述所有配置项详情,可参与《 AnyRobot Family 产品使用指导》配置服务节进一步了解。