更新时间:2023-08-24 10:06:25

1. 进入知识抽取页面,在左侧数据列表添加您此次抽取的数据,此时右侧显示选择对象的数据预览。用户可以单击【分类方式】按钮自主切换数据抽取列表的分类方式,包括按数据源或者模型查看;也可以在右侧数据预览顶部单击【视图切换】按钮,选择切换成模型视图和表格视图。

2. 用户还可以选择“使用SQL抽取”,无需再对业务数据进行处理,仅需写SQL语句,即可将运行结果作为一张虚拟视图表在下一流程进行数据映射。操作步骤如下所示:

参数 说明
数据源名

数据源名只由中英文、数字、下划线组成,长度为1-50位;

数据源名是指用于编写SQL抽取数据的数据源。可选数据源名的范围是在流程二-选择数据源中勾选添加的所有数据源(选项过滤掉类型为RabbitMQAS结构化、AS非结构化的数据源)。

数据文件名称

数据文件名称只由中英文、数字、下划线组成,长度为1-50位;

数据文件名称是使用SQL抽出生成的新的数据文件的名称。

SQL查询语句

SQL查询语句是指用于生成新的数据文件的SQL语句;

不支持运行修改数据的语句。

 

注意:

  1. SQL语句的编写仅支持查询语句,不支持insert、update、delete等对数据可以进行修改的语句;
  2. 用户使用SQL抽取的数据会影响构建效率,需尽量优化好sql语句或少使用 join 及子查询

3. 若用户在流程二-选择数据源中选择了Hive数据源类型,可以在此进行Hive数据源分区配置,按分区字段进行抽取,提高抽取效率。

4. 以上配置完成后,单击【确定】/【保存】>【下一步】按钮,进入流程5——知识映射页面。
 

说明:

  1. 用户在进行Hive分区配置时,抽取的数据表中的字段类型为日期格式;
  2. 完成Hive分区配置后,用户选择【全量构建】知识图谱时则只针对配置了Hive分区的数据表进行全量构建,并非全部数据表。