更新时间:2022-11-23 14:59:10
服务质量目标(Service Level Objective,SLO)用于定义服务质量指标(Service Level Indicator,SLI)的目标值,目标值明确了服务使用者对服务质量的期望水平。当SLI≥期望目标时,表示实际服务质量满足服务使用预期,如:某服务的SLO描述为“过去7天,至少90%的时间里服务是可用的“,则过去7天内的SLI需≥90%方可达成SLO,满足服务预期。
注意:在服务健康度分析模块中,SLI是对服务可用时间的计算,其计算结果度量的是服务可用时间的占比情况。
服务健康度分析模块支持对服务进行SLO建模,通过评估SLI在指定服务周期内较目标值的完成情况,可实时监测IT环境各服务的运行情况,帮助及时排查服务不可用风险。下文具体介绍如何为服务配置 SLO:
1. 创建服务
进入服务配置页面后,在服务配置表单的最上方设置基本服务信息,具体配置限制参见下表:
元素名称 元素说明 限制条件
*服务名称 设置服务的名称 ≤32个字符
标签 设置服务的标签标识 最多可支持添加5个标签
2. 新建SLO目标项
在服务配置表单的SLO配置区域,点击【新建目标】可新建SLI目标,如下所示:
提示:最多可支持添加3个SLO目标项。当完成3个目标项的创建后,【新建目标】按钮处禁用状态,此时可点击操作列中的编辑/删除按钮,修改/删除已有目标项。
3. 配置SLO目标项
设置服务时间周期和此周期内期望服务达到的可用率,如:时间窗口设为7天、目标设为80%,表示7天内服务的可用时间需≥5.6天,方可达成此SLO。具体参数说明如下:
元素名称 元素说明 限制条件
*时间窗口 设置服务时间周期
  • 时间窗口为 1-365的正整数,单位为天,不得重复;
  • 不支持重复创建。

注:当填写小于1的值时,窗口自动校准为1;填写大于365的值时,自动校准为365。

目标 设置期望达到的服务可用率
  • 目标值取值范围为1-100的正整数,单位为%

注:当填写小于1的值时,窗口自动校准为1; 填写大于100的值时,自动校准为100。

4. 配置剩余错误预算阈值
在服务健康度分析模块中,剩余错误预算是指服务周期内剩余的可容忍的服务不可用时间。如:7天SLO=80%,总错误预算=(100%-80%)×7=1.4天,剩余错误预算=1.4天-已用不可用时间(假设为0.4天)=1天。表示此SLO允许7天内有1.4天服务不可用,当前时间点允许服务的不可用时间剩余1天。
通过设置剩余错误预算的阈值区间,可将服务周期内剩余的服务不可用时间映射为对应的SLO严重等级,直观展示SLO的严重性。点击【+添加阈值段】可自定义错误预算的阈值区间,具体参数说明参见下表:
元素名称 元素说明 限制条件
严重性

表示错误预算对应的SLO严重等级:

严重、 高危、 正常

  • 默认无SLO严重性;
  • 最多可支持添加3个严重等级;
  • 同一等级的严重性仅可设置一个阈值区间。

提示:服务健康度分析模块支持对SLO严重性的告警,详情请参见 配置管理-配置告警

完成服务SLO的配置后,您可在服务分析器模块查看此服务SLO维度的监控信息。