更新时间:2022-08-13 21:30:54
时间序列预测的主要目的是根据已有的历史数据进行分析预测,目前支持通用场景、容量预测两种场景化预测:
• 通用场景为对通用指标数据的预测,例如:根据服务的历史访问日志数据,对未来一周的访问请求数据进行预测,运营人员可根据预测结果分析用户留存等问题,挖掘问题本质;
• 容量预测场景为对目前容量的可用时间预测,例如:虚拟机的资源依赖于集群主机的CPU、内存以及存储主机的储存资源,根据这些资源的历史增长情况,预测当前资源容量可使用的时间,管理员可根据预测结果规划这些资源的使用,稳定虚拟机的运行性能和服务质量。
一个完整的时间序列预测任务分为 5 个部分,数据源配置、数据预处理、模型计算、字段填充和定时任务:
• 数据源配置:用于准备数据,以实现数据分析及分析维度的可视化展示;
• 数据预处理:用于缺失值处理配置,避免因数据缺失导致无法计算的情况;
• 模型计算:用于提供不同场景、多种算法,可根据实际需求选择不同的场景、算法及参数进行模型计算;
• 字段填充:用于对预测结果的二次处理,在预测结果数据中增加字段内容,可用于可视化展示;
• 定时任务:用于启用定时执行异常检测任务,支持查看执行任务详情记录。
新建时间序列预测任务,具体操作如下:
1. 进入机器学习页面,点击【新建】进入新建机器学习任务页面,点击【查看帮助】可查看时间序列检测机器学习任务的简介和应用场景示例,如下所示:
2. 点击【时间序列预测】进入参数配置页面,点击右上角【查看帮助】可翻页查看时间序列预测的简介、使用帮助、参数配置指导、算法介绍;
3. 配置数据源:
数据源部分用于以可视化方式展示原始数据、数据统计信息以及趋势图。
1)配置数据源:填写数据源配置信息。时间序列数据预览配置步骤,除桶只能选择时间类型外,其他与单维度异常检测配置一致,详细请参见 单维度异常检测 章节;
2)点击【预览】可查看数据预览结果,如下所示:
数据预览结果包括:数据趋势图和原始数据列表。 4. 配置数据预处理:
时间序列预测数据处理分为:缺失值方法和预处理 2 个部分,如下所示:
1)配置缺失值处理方法模块:通过选择不同的缺失值处理方法可以对数据中的缺失值进行填充,提升数据质量;
2)配置预处理部分:可以选择不同的方法进行数据预处理,目前支持极差标准化和 Z-Score 标准化 2 种类型。
► 标准化:即方差计算,方差是平均值的对比:
• 极差标准化:极差又称范围误差或全距,用于统计数据中的变异点数量,极差值即为最大值与最小值之间的差距。极差标准化可体现一组数据波动的范围,极差越大,离散程度越大;
• Z-Score 标准化:即零-均值规范化,也称标准差标准化,是数据规范化处理的方式之一。可用于数据分布过于凌乱,无法判断最大值与最小值,或数据中心存在过多变异点的场景。
3)点击【应用】,执行成功后显示【查看结果】按钮,点击可查看数据预处理后的字段结果,如下所示:
5. 配置模型计算:
模型计算目前支持两种场景,分别为通用场景及容量预测场景,通用场景为对通用指标数据的预测,容量预测场景为对目前容量的可用时间预测,两种场景的具体配置如下:
► 通用场景:
时间序列预测的通用场景需要配置算法相关参数,时间序列预测支持一次指数平滑、二次指数平滑、三次指数平滑 3 种算法。对于某些算法参数,AnyRobot 可以自动适应参数;如需手动添加,可勾选手动设置算法参数进行设置。
► 一次指数平滑:一种特殊的加权平均法,适用于水平型曲线的数据。 点击【计算】查看时间序列预测结果,如下所示:
时间序列预测模型计算结果说明: ► 二次指数平滑:基于一次指数平滑结果再次进行平滑处理,从而保留数据的趋势信息。适用于斜坡型时序数据,可预测具有趋势性的时间序列。 点击【计算】查看时间序列预测结果,如下所示:
► 三次指数平滑:在二次指数平滑的基础上保留了季节性信息,可预测带有季节性的时间序列。适用于同时含有趋势性和季节性的序列数据,多应用于抛物线型数据。 点击【计算】可查看时间序列预测结果,如下所示:
► 容量预测:
时间序列预测的容量预测场景除需配置上述算法参数以外,还需配置容量相关参数,具体参数配置如下:
点击【计算】可查看时间序列预测结果,时间序列预测容量预测场景下模型计算结果展示除折线图、拟合优度、均方根误差以外,还包括预计可用时间,表示当前容量的资源预计可用的时间,单位为天,如下所示:
说明:容量预测需要历史数据的累积,一般需要一个半月的历史数据。
6. 完成上述所有配置后,点击【保存】填写机器学习任务名称,点击【确认】即可完成机器学习任务创建操作。
说明:
• 字段填充配置功能详细参见 单维度异常检测-字段填充配置 章节,时间序列预测的字段填充结果的字段名存于搜索页面的ml-forecast字段库下。
• 定时任务配置功能详细可参见 单维度异常检测-定时任务配置 章节,时间序列预测定时任务暂不支持告警联动功能。
• 通用场景为对通用指标数据的预测,例如:根据服务的历史访问日志数据,对未来一周的访问请求数据进行预测,运营人员可根据预测结果分析用户留存等问题,挖掘问题本质;
• 容量预测场景为对目前容量的可用时间预测,例如:虚拟机的资源依赖于集群主机的CPU、内存以及存储主机的储存资源,根据这些资源的历史增长情况,预测当前资源容量可使用的时间,管理员可根据预测结果规划这些资源的使用,稳定虚拟机的运行性能和服务质量。
一个完整的时间序列预测任务分为 5 个部分,数据源配置、数据预处理、模型计算、字段填充和定时任务:
• 数据源配置:用于准备数据,以实现数据分析及分析维度的可视化展示;
• 数据预处理:用于缺失值处理配置,避免因数据缺失导致无法计算的情况;
• 模型计算:用于提供不同场景、多种算法,可根据实际需求选择不同的场景、算法及参数进行模型计算;
• 字段填充:用于对预测结果的二次处理,在预测结果数据中增加字段内容,可用于可视化展示;
• 定时任务:用于启用定时执行异常检测任务,支持查看执行任务详情记录。
新建时间序列预测任务,具体操作如下:
1. 进入机器学习页面,点击【新建】进入新建机器学习任务页面,点击【查看帮助】可查看时间序列检测机器学习任务的简介和应用场景示例,如下所示:
2. 点击【时间序列预测】进入参数配置页面,点击右上角【查看帮助】可翻页查看时间序列预测的简介、使用帮助、参数配置指导、算法介绍;
3. 配置数据源:
数据源部分用于以可视化方式展示原始数据、数据统计信息以及趋势图。
1)配置数据源:填写数据源配置信息。时间序列数据预览配置步骤,除桶只能选择时间类型外,其他与单维度异常检测配置一致,详细请参见 单维度异常检测 章节;
2)点击【预览】可查看数据预览结果,如下所示:
数据预览结果包括:数据趋势图和原始数据列表。 4. 配置数据预处理:
时间序列预测数据处理分为:缺失值方法和预处理 2 个部分,如下所示:
1)配置缺失值处理方法模块:通过选择不同的缺失值处理方法可以对数据中的缺失值进行填充,提升数据质量;
2)配置预处理部分:可以选择不同的方法进行数据预处理,目前支持极差标准化和 Z-Score 标准化 2 种类型。
► 标准化:即方差计算,方差是平均值的对比:
• 极差标准化:极差又称范围误差或全距,用于统计数据中的变异点数量,极差值即为最大值与最小值之间的差距。极差标准化可体现一组数据波动的范围,极差越大,离散程度越大;
• Z-Score 标准化:即零-均值规范化,也称标准差标准化,是数据规范化处理的方式之一。可用于数据分布过于凌乱,无法判断最大值与最小值,或数据中心存在过多变异点的场景。
3)点击【应用】,执行成功后显示【查看结果】按钮,点击可查看数据预处理后的字段结果,如下所示:
5. 配置模型计算:
模型计算目前支持两种场景,分别为通用场景及容量预测场景,通用场景为对通用指标数据的预测,容量预测场景为对目前容量的可用时间预测,两种场景的具体配置如下:
► 通用场景:
时间序列预测的通用场景需要配置算法相关参数,时间序列预测支持一次指数平滑、二次指数平滑、三次指数平滑 3 种算法。对于某些算法参数,AnyRobot 可以自动适应参数;如需手动添加,可勾选手动设置算法参数进行设置。
► 一次指数平滑:一种特殊的加权平均法,适用于水平型曲线的数据。 点击【计算】查看时间序列预测结果,如下所示:
时间序列预测模型计算结果说明: ► 二次指数平滑:基于一次指数平滑结果再次进行平滑处理,从而保留数据的趋势信息。适用于斜坡型时序数据,可预测具有趋势性的时间序列。 点击【计算】查看时间序列预测结果,如下所示:
► 三次指数平滑:在二次指数平滑的基础上保留了季节性信息,可预测带有季节性的时间序列。适用于同时含有趋势性和季节性的序列数据,多应用于抛物线型数据。 点击【计算】可查看时间序列预测结果,如下所示:
► 容量预测:
时间序列预测的容量预测场景除需配置上述算法参数以外,还需配置容量相关参数,具体参数配置如下:
点击【计算】可查看时间序列预测结果,时间序列预测容量预测场景下模型计算结果展示除折线图、拟合优度、均方根误差以外,还包括预计可用时间,表示当前容量的资源预计可用的时间,单位为天,如下所示:
说明:容量预测需要历史数据的累积,一般需要一个半月的历史数据。
6. 完成上述所有配置后,点击【保存】填写机器学习任务名称,点击【确认】即可完成机器学习任务创建操作。
说明:
• 字段填充配置功能详细参见 单维度异常检测-字段填充配置 章节,时间序列预测的字段填充结果的字段名存于搜索页面的ml-forecast字段库下。
• 定时任务配置功能详细可参见 单维度异常检测-定时任务配置 章节,时间序列预测定时任务暂不支持告警联动功能。
< 上一篇:
下一篇: >