超级助手的组成
一个超级助手需要由以下几个必备要素构成,知识来源,技能,模型和Dolphin-Lang等组成,如果将超级助手比作一个人的话,那么其必备要素的组成如下所示:
›知识来源:血液-营养来源,即超级助手回答问题的信息来源,包括文档、业务知识网络。具体数据类型包括:内容数据、结构化数据、机器数据、组织元数据等。
›技能:手和脚-动力系统,用以扩展DataAgent的能力边界,处理更复杂的任务。技能包括工具、技能Agent、MCP。
- DataAgent :是一种借助各类模型(大/小模型)、知识库、记忆、技能、数据流等多种基础功能, 实现智能化的交互、任务执行、决策的智能体。 基于 DataAgent 服务,可以快速构建智能体应用-超级助手,满足实际业务需求。DataAgent分类包括:
- 按用途分:
- 普通Agent:普通DataAgent发布后,作为超级助手供用户进行使用。
- 技能Agent:技能DataAgent发布后,作为技能供用户创建DataAgent、算子、工作流等进行调用。
- 按重要程度分:
- 系统Agent,与DIP系统关联性较大,是比较重要的Agent, 只有指定角色才可以创建和管理。如:深度搜索Agent
- 普通Agent,应用户的需求基于一定的用途而创建的Agent。如:西藏旅行Agent
- 按用途分:
- 工具:工具是API调用、数据库查询、搜索引擎或者其他Agent提供的服务,可以使用的外部资源和能力。例如,在创建的DataAgent 内添加新闻搜索工具,那么此DataAgent 将拥有搜索新闻资讯的能力。
- MCP: MCP全称为Model Context Protocol(模型上下文协议), 是 一个开放的、通用的、有共识的协议标准。MCP 提供了一种统一的方法,将 AI 模型连接到各种数据源和工具。让 AI 模型能够与不同的数据源和工具进行无缝交互。它旨在替换碎片化的 Agent 代码集成,使 AI 系统更可靠、更高效。
›模型:大脑-思维中心。DIP支持集成各类大模型和小模型,可利用标准化接口快速调用、组合模型,供用户选择和使用。
›Dolphin-Lang:神经-传导系统。爱数自研的一种简单并易于普通用户操作和理解的编程语言,旨在降低普通用户在专家模式下进行编程的难度,提高开发效率。通过Dolphin-Lang,用户可灵活的调用各种技能,形成定制化任务流程。
创建超级助手
用户可通过DataAgent的制作,来创建符合自己需求的超级助手。创建一个超级助手,需要对其必备要素等进行配置。
点击 首页 > 应用 > DataAgent,点击【新建】,进入DataAgent配置页面,详细具体步骤如下所示:
说明:也可通过进入应用 > 空间> 个人空间>我的创建页面,点击【+新建】,进行DataAgent创建。
步骤1. 基本信息配置,输入DataAgent 的名称,简介,设置头像。
步骤2. 定义角色指令,可采用自然语言模式或使用Dolphin,切换至专家模式进行编写。
›采用自然语言模式
可根据角色指令的格式指南,进行提示词撰写;也可采用AI生成。
›使用Dolphin
说明:
关于Dolphin-Lang撰写:具体撰写Dolphin-Lang的相关说明,请参考用户指导:如何撰写Dolphin-Lang?
关于输出配置:
-
- 最终输出结果:从多个Dolphin语句的输出变量中选择一个作为“最终输出结果”
- 相关问题:如果Dolphin语句中配置了“相关问题”,并需要在页面上展示“相关问题”,需要设置此字段
- 中间过程展示:如果想要展示中间过程中的某些过程变量信息,需要设置此字段
步骤3. 所属产品配置,明确所创建的DataAgent的归属。默认选中“DIP”,点击后出现下拉菜单,当前包括:DIP、AnyShare。
步骤4. Agent类型配置,明确所创建的DataAgent为普通Agent或者系统Agent。
- 系统Agent,与DIP系统关联性较大,是比较重要的Agent, 只有指定角色才可以创建和管理。如:深度搜索Agent
- 普通Agent,应用户的需求基于一定的用途而创建的Agent。如:西藏旅行Agent
步骤5. 输入配置,明确需要让DataAgent接收哪些信息。支持添加文本、文件、对象。默认对象配置包括:
- query-用户在超级助手交互对话框输入的问题
- history-用户在所有dataAgent的历史对话信息,包含用户和超级助手的对话记录
- tool-工具执行时具体的参数信息,对象类型包括会话ID、工具名称和参数列表
- header-请求头内容,对象类型包括授权信息和用户ID等
- self_config-用户当前Agent的配置信息,对象类型,包含数据源配置和高级配置等
支持选择的文件类型,包括:
当选择文件变量时,可具体对选择文件的方式、文件类型、文件数量和大小等进行具体设置。
支持选择的文件类型,包括:
步骤5. 知识来源配置,可选择已安装的产品的数据源,包业务知识网络、文档。文档包括两个数据源:文档库-DIP的文档库、AnyShare。
- 文档召回设置,如下图:
相关配置项说明:
-
-
召回切片数:设定需召回的数据切片数量,明确处理范围。保障处理效率与信息完整性。
-
重排序后保留切片数:确定重排序后保留的切片数,细化结果。提升输出结果精确度。
-
每篇文档最大保留切片数:限制单文档保留切片数,平衡信息。确保结果呈现多样性。
-
获取下文切片数:预设需获取的后续切片数量,加强连贯性。使内容衔接更流畅。
-
获取上文切片数:规定需参考的前文切片数量,辅助理解。提供背景信息支持。
-
来源文档数:设定召回文档的数量上限,简化流程。缩小处理范围提升速度。
-
文档ranker bge相似度阈值:设定相似度阈值以筛选文档,精准匹配。保证结果高度相关。
-
召回最大长度:限制召回内容的最大长度,避免冗余。保持输出简洁高效。
-
- 业务知识网络召回设置,如下图:
相关配置项说明:
-
- 文本匹配召回对象数量:设定通过文本匹配召回的对象数目。用于控制初步筛选的候选量。
- 向量匹配召回对象数量:确定基于向量相似度召回的对象数。辅助找到语义相近的内容。
- 重排序后保留参考信息数量:规定重排序后保留的参考信息数。确保输出关键且精简的信息。
- 长文本:定义字符串长度超过多少算长文本,以区分普通文本与长文本,便于系统采取不同处理策略。
- 业务知识网络ranker bge相似度阈值:设定业务知识网络筛选的相似度标准。过滤低相关性内容。
- 召回最大长度:限制召回内容的最大字符长度。防止返回内容过多,保证效率。
添加知识网络:添加对应的业务知识网络后,可选择添加类,如下图所示:
说明:
- 添加文档库前,需要先用此DIP的账号登录文档库,示例如:10.4.111.140/anyshare/zh-cn/
- 添加AnyShare前,需要先建立AnyShare数据源,具体创建相关说明,请参考用户指导:数据源
- 添加业务知识网络前,请先前往“业务知识网络”等相关功能模块,创建业务知识网络,具体创建相关说明,请参考用户指导:如何构建业务知识网络?
步骤6. 添加技能,支持选择一个或多个技能,扩充此DataAgent等能力边界,共同完成更复杂的任务。包含工具、MCP和技能Agent。其中包括系统内置工具:数据处理工具,文件处理工具和搜索工具等。可根据需要进行选择。
›技能-工具配置:可根据实际需要,对工具的各种参数进行具体设置,包括固定值、引用变量、选择模型、模型生成。
说明:
-
- 引用变量:
- 当值选中【引用变量】时,在下拉框中展示输入变量 和Dolphin变量;
- 当引用变量选中用户自定义的object类型的变量时,置入下拉框中可继续输入,通过输入的方式来取出变量的部分内容;
- 当引用变量选中系统内置的object类型的变量时,可通过下拉选取下级字段
- 引用变量:
-
- 选择模型:需要对模型的连通性做测试,并对需要对模型进行具体参数设置。
-
-
- 随机性:控制生成文本的随机性。这个参数可以控制生成文本的多样性,以避免生成过于相似的文本。默认值1,最大值2,最小值0。
- 核采样(采样样本):控制生成文本的概率阈值。这个参数可以控制生成文本的多样性,以避免生成过于相似的文本。默认值1,最大值1,最小值0。
- 单次回复限制:控制生成文本的最大长度。这个参数可以控制生成文本的长度,以避免生成过长的文本。
- 前k采样:控制生成文本时,从概率前k高的词汇中随机选择下一个词汇。这个参数可以限制生成词汇的选择范围,以避免生成过于低概率的词汇,从而影响文本质量。k值越大,选择范围越广,生成文本的多样性越高;k值越小,选择范围越窄,生成文本越倾向于使用高概率词汇,文本可能更保守和常见。
- 话题新鲜度:控制生成文本的存在惩罚。这个参数可以控制生成文本中不存在的单词和短语的数量,以避免生成过于不连贯的文本。默认0,最大值2,最小值-2。
- 频率惩罚度:控制生成文本的频率惩罚。这个参数可以控制生成文本中重复的单词和短语的数量,以避免生成过于重复的文本。默认值0,最大值2,最小值-2。
-
›技能-Agent配置:可根据实际需要,对Agent的各种参数进行具体设置,包括固定值、引用变量、选择模型、模型生成。数据源及大模型可选择自身配置或继承主Agent。
说明:
-
- 人工干预功能:支持人工干预技能调试工具,点击“
/
”切换干预功能的启停状态,您可以为每个Agent或工具(tool)配置人工干预开关。开启后,若工具/Agent配置了针对特定工具的中断标识,系统检测到此工具时,会中断工具/Agent的运行过程,并询问工具是否执行并确认工具参数是否正确。以便在与大模型的交互过程中,监控大模型的执行,保证输出的正确性。
- 添加技能前请创建好相关工具/Agent/MCP,即可在此处进行调用。
- 具体创建技能相关说明,请参考用户指导:如何创建技能?
- 技能Agent创建参考本文内容即可。
- 人工干预功能:支持人工干预技能调试工具,点击“
步骤7. 模型配置,支持根据用户具体的需求,选择一个或多个大/小模型(添加的多个模型主要用来在写dolphing时调用)。选择模型后,需测试连接,然后进行具体的模型配置。
- 生成自然语言文本(如写作、对话)→ 选大语言模型;
- 解决逻辑问题、数学计算或复杂决策 → 选推理模型。
步骤8. 长期记忆配置,启用长期记忆后,Agent将能够记住和利用用户的历史聊天信息进行输出,以便提供更精准的答案。
步骤9. 默认开场白配置
- 开场白:可根据具体的需求对结果输出的开场白进行自定义设置,支持AI自动生成。例如:您好!根据详细的调研和分析,形成的建议如下......
- 预设问题:可根据具体的需求对结果输出的预设问题进行自定义设置,支持AI自动生成。可添加1个或多个预设问题。例如:为什么需要进行此次调研和分析?
步骤12. 预览与调试。DataAgent配置完成后,点击Debug【调试预览】,通过测试数据验证输出逻辑是否正常,同时查看输出结果是否符合预期。支持以markdown、json的格式进行输出。
步骤13. 发布配置。通过调试后,点击保存>发布。
说明:
- 可见范围:可选择全部用户,或者指定组织结构、用户组、应用账号。
- 同时发布为其他类型:
- API Agent:发布后,可在应用>全部>DataAgent或者应用>全部>个人空间>我的创建>DataAgent 查看此Agent时,点击
,即可查看此API相关信息。
- 技能Agent:发布后,可在创建DataAgent,添加技能Agent时,进行查看添加。或者在创建算子时,选择执行操作>AI能力>智能体,进行查看添加。
- 数据流Agent:发布后,可在创建数据流时,选择执行操作>AI能力>智能体,进行查看添加。
- API Agent:发布后,可在应用>全部>DataAgent或者应用>全部>个人空间>我的创建>DataAgent 查看此Agent时,点击
查看DataAgent
当创建Agent后,可在应用>全部>DataAgent或者应用>全部>个人空间>我的创建>DataAgent,查看创建的Agent,包括最近访问,按分类浏览。