更新时间:2024-05-17 13:25:06

在创建知识图谱时,当您创建本体完成后,您需要配置实体类、关系类与数据表映射关系。

 

1. 进入知识图谱构建“流程四:知识映射

 

功能说明

您可以单击拖拽左工作面板和右工作面板中间线调整面板大小。

工作面板分为左工作面板右工作面板

区域 功能
左工作面板
  • 提供查看本体结构及映射情况
  • 支持切图左工作面板视图
  • 支持快速检测未配置项
  • 支持画布拖拽、放大、缩小、1:1视图
工具栏(右侧工作面板上方)
  • 添加数据按钮
  • 自动映射属性按钮
  • 删除映射属性按钮
右工作面板
  • 将数据文与实体类/关系类的属性相互关联
  • 支持画布拖拽元素、放大、缩小、1:1视图

 

配置实体类映射:以快速选择方式添加数据

1.在左工具面板中单击“实体类”。

2.在右侧工具面板中可查看实体类名、实体类显示名、属性及属性值。

3.在右侧上方工具栏选择“添加数据 > 快速选择”按钮,弹出“快速选择”弹窗。

4.在弹窗中,单击实体类需映射的“数据源文件”,并在右侧查看数据文件内容。

5.配置数据源文件抽取规则。

(1)单击“数据表头”勾选需要配置抽取的数据字段。可通过单击【抽取设置】按钮,弹出“抽取设置”弹窗。

配置填写如下:

参数 说明
抽取规则

1.默认抽取数据源文件中所有字段

2.单击复选框勾选需要抽取的数据字段。

3.当选择数据源文件为CSV

(1)可设置文件解析规则。包含“分隔符”、“文本标识符”、“文本标识转义符”。

(2)设置文件解析规则后,下方可实时查看解析后文件内容。

分区设置

1.当Hive数据库的数据表创建分区

2.在使用Hive数据源可使用分区字段支持分区变量。

  • 分区变量示列:
    • 前一天的数据:$date_format($date_add($current_timestamp(),-1),'YYYYMMdd')
    • 当天的数据:$date_format($current_timestamp(),'YYYY-MM-dd')
    • 后一天的数据:$date_format($date_add($current_timestamp(),1),'YYYY/MM/dd')
    • 前一天的前一个小时的数据:$date_format($hour_add($date_add($current_timestamp(),-1),-1),'YYYY-MM-dd:HH')
  • 预览
    • 当输入完分区变量后,单击【预览】按钮,可查看变量时间

(3)选择数据源完后,单击【确定】按钮。返回“流程4:知识映射”界面。

 

配置实体类映射:以SQL创建方式添加数据

1.在左工具面板中单击“实体类”。

2.在右侧工具面板中可查看实体类名、实体类显示名、属性及属性值。

3.在右侧上方工具栏选择“添加数据 > SQL创建”按钮,弹出“SQL”弹窗。

填写内容如下:

参数 说明
SQL查询语句存储名称

1.用于存储SQL查询语句的表的名称

2.SQL查询语句存储名称只能由中英文、数字及下划线,长度为1-50位。

数据源名

选择“流程二:数据源名称”

SQL查询语句

1.使用SQL查询数据语句

  • 仅支持对数据库的单条查询语句。若SQL中涉及JOIN操作,该操作涉及到两个表之间的连接字段。最好存在索引,避免造成全表扫描,应确保查询结果无重复字段名。

4.编辑完成SQL查询语句后,单击【运行并预览】按钮,下侧显示查询结果。

5.基于查询结果,支持配置“抽取规则”,详情本文档“快速选择”

6.配置完成后,单击右下角【确定】按钮,返回“流程四:知识映射”。

 

连接实体类与数据源文件映射关系

1.当实体类属性与数据源字段完全匹配时,系统将自动连接映射关系

2.当实体类属性与数据源字段不匹配时,需手动连接。

  • 长按实体类的属性【+】按钮,鼠标拖动至需连接的数据源字段前方【o】释放鼠标

 


 

注意:

1.当前版本仅支持实体类与数据源文一对一匹配。
2.若添加数据源,则必须配置实体类默认显示属性、融合属性与数据文件关系。
 
 

删除实体类与数据源文件映射关系

1.悬停已连续的是实体类与数据文件的连线,单击【x】按钮,则清除当前映射关系。

2.在右侧上方工具栏中,点击【删除映射属性】按钮,在右侧工作面板中清除当前实体类与数据源字段所有连接关系。

 

自动连接实体类与数据源文件映射关系

1.当实体类与数据源字段完全相等时,点击【自动映射属性】按钮,在右侧工作面板中系统自动生成连接关系

 


 

提示:

1.当“流程三:创建本体”时,使用“批量导入实体类”功能导入实体类且无编辑属性名称,则系统将自动为您匹配实体类与数据源文件关联关系。

 

 

配置关系类映射

情况一:三张数据源文件,其中二张实体类、一张关系类

操作如下:

1.单击“添加数据>快速选择或SQL创建”添加关联属性数据文件,建立数据源文件与关系类连接映射。操作可参考“配置实体类映射”。

2.当属性完成配置后,手动将关系类数据源文件字段与选择起点属性、终点属性连接。

 

情况二:二张数据源文件,其中一张实体类,一张实体类+关系类

操作如下:

1.在右侧工作面板中,单击切换起点/终点属性

2.手动将起点属性、终点属性连接完成映射关系。

 

情况三:模型

1.在左侧工作面中单击任意模型中实体类/关系类

2.在右侧上方工作栏中单击“添加数据>快速选择”添加非结构化数据文件。

3.选择完成后,单击【确定】按钮,返回“流程四:知识映射”页面。

4.系统自动连接关系。

(1)支持查看添加的文件夹内容详情。

(2)支持刷新文件内容。

(3)支持快速删除绑定的非结构化文件。

 

知识映射配置完成后

1.单击【提交配置】按钮,选择运行方式,详情请见“知识图谱:任务”

2.点击【保存】按钮,则保持当前配置内容