更新时间:2023-06-13 15:32:34

KPI智能分析方案,以保障用户的IT设备和业务服务的可用性为核心。方案创新性的使用业务建模的方式,构建全局运维视图,展示出IT和业务服务的关系,用服务分析器把设备和业务做逻辑上的服务拆分,并为每一个服务进行健康度打分,继而加权计算出设备和业务的健康度,同时引入趋势预测算法,把海量数据的价值充分释放,根据历史数据的规律来预测设备和业务未来一段时间的运行趋势,帮助运维人员更好的了解设备和业务的可用性。

方案中引入静态阈值做指标的异常检测,有效减少告警的漏报和误报,同时引入算法对告警做压缩和降噪;在快速定位故障的环节,对于关联性特别明显的故障,使用树状的服务分析器直接可以看到故障位置,面对关联性较弱或者有间接性关联的,使用深度分析做深入的洞察。

整个方案是建立在统一日志管理平台的基础上,需要先做好日志数据的治理,再针对各个运维对象的关键指标进行分析。