什么是数据流?
数据流是业务过程中任务按照特定规则自动流转的模型,支持通过模版创建。它把分散任务整合为连贯流程,通过设定触发条件、流转逻辑,让任务在系统或人员间自动传递,实现业务自动化运作。
在传统业务场景中,人工进行数据各种处理操作既费时又费力,且容易出错,有了自动化数据流,就可以对您的各种数据处理过程自动化运行,例如:数据查询、数据分析、数据存储、数据转换等等。同时,还可以运用模型以及智能体的能力,使数据流更加智能化,提高工作效率。
数据流相关概念
›触发动作:
触发动作是自动化数据流的起点,根据该触发动作的状态变化,来作为自动化流程是否执行的起始判断,例如上述案例中,在知识库上传一个新的文档就是流程的开始。
常见的触发动作有定时触发、事件触发、手动点击触发,下面将带您了解这几种触发动作的基本概念:
- 定时触发:触发动作为循环的时间周期或时间点,例如每x分钟、每x小时、每天或每周等固定周期。在实际工作中,有一些任务需要在特定的时间完成,主要适用于消息提醒类的场景,可以规定数据流运行的时间和频率。示例:文件更新后自动通知到相关人员、每周自动提醒项目负责人更新进展、定期将数据备份到指定的文件夹等。
- 事件触发:通过设置指定操作事件作为触发动作。一般适用于需要对文件和文件夹进行数据新建或变更操作的场景,也就是需要选择目标文件夹,并且在该文件夹下进行上传、复制、移动或删除的动作时,再执行下一步的操作。示例:新建文件夹时,自动将文件夹名称添加到编目模板。
- 手动点击触发:手动触发是在设置完自动化任务后,需要您手动点击运行,才会触发下一步的执行动作。与事件触发不同,手动触发的对象是针对已经上传至某个文件夹下的文件或文件夹,再手动点击,去进行下一步需要执行的动作,主要用于数据同步的场景。示例:在文档中心里存放了一个创建时间过长的文件夹,可设置自动归档到另一个指定的文件夹。
- 表单触发:设置表单提交为触发动作。适用于利用表单协同办公的场景,可以是文档权限的申请、合同类文件审核通过后的流转管理、填写表单发起扩容申请流程等。
›执行条件:
执行条件也叫逻辑动作,只有满足这个条件,才会往下执行设定的操作。通俗来讲就是数据流中的分支,分支的运行顺序是按照分支从左往右依次匹配,只有当前分支条件满足后,才执行该分支的流程。一个分支操作内的所有分支执行完毕后,再执行分支外的操作。上述案例中,“审核通过→文件上传”可以理解为该流程中的分支1,而如果审核不通过,则可以删除该文件,那么“审核不通过→删除文件”就是分支2。
›执行动作:
执行动作是指前面的触发动作发生,判断条件满足以后,自动让数据流执行指定的操作事件,例如上述案例中,满足审核通过的条件后,“文档在知识库上传发布”就是让数据流执行的操作。
创建数据流方式
- 从空白新建
- 从模版新建
从空白创建数据流步骤
›基本步骤如下:选择数据源→设置执行操作→设置触发器
- 第1步:点击数据源>数据流>新建,进入数据流新建页面。
- 第2步:选择数据源,配置需要具体进行处理的数据,可选择结构化数据,非结构化数据。
-
第3步:设置执行操作
执行操作是指当触发器事件发生后,用于处理数据或传递数据而执行实际的具体操作。同一个流程中,您可以设置一个或多个执行操作。
说明:写入图数据库、Python代码执行、JSON、AI能力为系统内置算子;其他为导入算子。如果列举数据流不能满足用户需求,可导入自己创建的算子。
- 第4步:设置触发器
触发器可以理解为“当某事件发生时,执行后续操作“中的某事件。在一个自动化工作流程中,触发器是自动化流程的开端,一个流程只能配置一个触发器,且不能删除。
›从空白新建场景示例
下文以构建数据流【简历提取元数据】为例,进行阐述。此数据流的主要目的是为了实现,当有简历新增时,自动提取简历中重要信息,供相关人员进行查看、查询。
- 第1步:点击数据智联>业务知识网络>新建>,进入业务知识网络新建页面,构建老师简历业务知识网络
构建的老师简历知识图谱如下所示:
说明:构建业务知识网络的具体方法,请参考如何构建业务知识网络章节内容。
- 第2步:点击数据智联>算子>我的算子>新建,进入算子新建页面,构建数据流中需要调用的相关算子。
说明:构建算子的具体方法,请参考如何创建技能章节内容。
- 第3步:点击数据智联>数据管道>数据流>新建,进入数据流新建页面,选择从模版新建
- 第4步:点击更新知识图谱,选择【老师简历】知识图谱,并对选择的实体信息以及文件储存的文件夹进行配置
- 第5步:选择数据源,根据输出的数据源数据类型选择,结构化数据/非结构化数据。此处需要数据流进行处理新增简历文档,即为非结构化数据;
- 第6步:选择执行动作-通过调用此算子实现获取变化简历ID
- 第7步:选择执行动作-通过此算子获取简历下载地址
- 第8步:选择执行动作-通过此算子输出所有简历内容
- 第9步:选择执行动作-通过此算子设置提取简历中的有用的重要信息以及相关输出格式要求
- 第10步:选择执行动作-通过此算子实现提取的简历重点内容进行输出
- 第11步:选择执行动作-通过此算子实现将简历中的每一个重点内容写入图谱
- 第12步:结束任务后,需要进行数据流触发条件的设置。即当有此简历文件夹下的文件变动时,触发此工作流。
- 第13步:工作流应用
从模版新建数据流步骤
›前提条件
- 构建业务知识网络
- 构建算子
›基本步骤
- 选择数据源→设置执行操作→设置触发器
›从模版创建场景示例
下文以构建数据流【创建用户时自动更新知识图谱】为例,进行阐述。此数据流的主要目的是为了实现,当有用户新增时,自动提取用户的相关信息,进行知识图谱更新。
- 第1步:点击数据智联>数据管道>数据流>新建,进入数据流新建页面,选择从模版新建
- 第4步:点击更新知识图谱,选择【AS默认图谱_1】;选择的实体信息,图谱内所有实体信息会显示出来,根据需要进行选择;添加文档库-对文件储存的文件夹进行配置;
- 第5步:引入已经配置好的算子,点击确定;
- 第6步:工作流创建成功;
- 第7步:验证-查看是否工作流新建好后,运行成功。新建用户:点击后台管理>用户>用户管理>新建用户;用户新建好后,回到数据流页面,点击运行统计。
- 第8步:选择执行动作-通过此算子输出所有简历内容
- 第10步:工作流应用。此工作流创建好后,会自动运行,当有新增用户时,即更新知识图谱;当用户在进行超级助手提问时,可以应用最新的相关信息进行问题回答。