更新时间:2026-01-05 17:52:41

功能概述

定义:智能体可观测性模块是为应用管理员提供的智能体运行监控与日志分析平台,用于追踪已发布智能体的执行情况、性能表现与问题定位。

功能目的:通过多层级数据下钻,帮助管理员全面掌握智能体的运行状态、识别异常、优化性能,并为后续版本迭代提供数据依据。

目标用户:应用管理员

功能位置:属于DIP平台智能体治理与运维层,向上提供运行洞察,向下对接智能体执行引擎与日志系统。

典型使用场景

场景名称:应用管理员查看已发布智能体的运行表现,定位执行异常

触发条件:业务用户反馈某智能体响应缓慢或结果异常,或管理员定期巡检智能体运行状况。

问题原因:智能体在运行过程中可能出现性能下降、调用失败、逻辑错误等问题,需管理员介入分析。

用户目标:管理员通过可观测性模块,从概览到详情逐层下钻,快速定位问题会话、分析执行链路、识别根本原因,并给出优化建议。

关键术语

术语 定义
会话 用户与智能体的一次完整交互过程,每个会话对应唯一的会话 ID。

功能结构

操作步骤

管理员通过打开目标Data Agent,点击轨迹分析,即可查看所有此智能体的聚合性能指标与最近会话记录。支持从首页逐级下钻至单次会话详情,再下钻至具体执行步骤,实现问题根因定位。

  • 全局聚合指标:页面顶部展示所选时间范围内(默认近一周)所有智能体的核心性能概览数据。
  • 会话列表:按时间降序展示所有会话记录,作为下钻分析的起点。支持按会话ID、时间范围筛选。

 

  • 分层下钻路径
    • 第一层:点击会话列表中的【查看详情】,进入单次会话详情页,分析该次交互的完整执行链路与问题。

      • 查看会话概览:页面顶部展示该会话的基本信息(如会话ID、起止时间、总耗时、状态)及聚合性能指标。

      • 查看执行步骤:页面主体按时间顺序展示本次会话的所有执行步骤(如意图识别、调用API、网络响应、错误处理等)

  • 分层下钻路径
    • 第二层:在会话详情页中,点击任一执行步骤,可进入执行步骤详情页,查看该步骤的详细时间线、输入输出日志及性能消耗

      • 查看步骤概览:抽屉/页面顶部展示该步骤的名称、状态、精确耗时(开始/结束时间)、Token消耗等关键元数据。

      • 查看执行时间线:以可视化时间轴展示该步骤内部子阶段(如请求发起、模型处理、网络传输、响应返回)的耗时分布。

      • 查看输入与输出:清晰展示该步骤的原始输入(如用户提问、API参数)与最终输出(如模型回复、API响应、错误信息)。

      • 查看日志与错误详情:如步骤执行失败,提供详细的错误码、堆栈信息或关联日志的查看入口。

 

  • AI智能分析:此模块为被动触发功能,旨在为管理员提供基于近期运行数据的智能优化建议。
    • 查看问题分析与优化建议:点击轨迹分析各页面右侧或底部的【AI智能分析】,可根据本次会话的执行结果,自动生成或展示AI分析出的问题描述、依据、影响与优化建议。示例如下:

注意事项

  1. 仅应用管理员可访问智能体可观测性模块,其他角色无此操作权限。
  2. 会话筛选功能目前仅支持时间范围筛选,按会话 ID、Agent 名称或状态筛选的功能暂未开放,后续将扩展支持。
  3. AI 智能分析结果依赖后台服务与运行数据,若数据量过少可能导致建议不够精准。

常见问题

Q1:进入可观测性监控视图后,未显示任何聚合性能指标与会话记录,是什么原因?
 
A1:可能存在以下原因:所选时间范围内智能体未被调用,无会话产生
 
Q2:点击【AI 智能分析】按钮后,提示分析失败,该如何处理?
 
A2:可先点击【重新分析】按钮重试,若多次重试仍失败,点击【查看详情】按钮查看错误日志,判断是否为网络问题或服务器异常。
 
Q3:为什么部分执行步骤的 Token 消耗显示 “-”?
 
A3:Token 消耗仅针对模型调用相关的执行步骤,如意图识别、模型响应等。非模型调用步骤(如网络传输、错误处理)无需消耗 Token,因此显示 “-”,属于正常情况。