更新时间:2024-07-19 13:59:59

功能概述

管理并储存benchmark配置,可以支持benchmark配置的创建、查看、编辑、复制、删除等功能。benchmark配置中包括数据集、指标、转换器、平均值的配置,可以被用于评估算法的性能。在机器学习和深度学习领域的场景中有很大的作用。

 

前提准备

步骤一:准备数据集

步骤二:创建指标

 

操作指引

1.进入Benchmark>Benchmark配置界面。

2.单击【新建】按钮,弹出“新建数据集”对话框。

3.在弹出的页面中,填写Benchmark配置名称、描述,并单击 【新建】按钮。进入配置画板

 

步骤一:benchmark配置信息

1.进入画布后,单击卡片,可修改benchmark配置信息。

 

步骤二:任务

1.在画布中单击benchmark配置信息卡片后【+】,可创建Task

2.在右侧侧边栏中可修改任务信息。

注意:

1.Task的命名尽量已能力为主:如语言、知识、推理、agent等

2.删除task时,同时会删除task后所有的配置信息(数据源、指标、adapter及榜单)

 

步骤三:数据集

1.在画布中单击task信息卡片后【+】,系统自动为您创建数据集、指标、adapter及榜单

2.编辑数据集卡片

(1)数据集命名 > 选择数据集版本 > 数据集版本中多文件 > 配置每个文件的Inputs、Outputs

  • Inputs:选择的是问题等。
  • Outputs:选择的是预期回答的结果或问题的正确答案。

注意:

1.至少配置一个文件,且文件中必须包含一个input和output。

2.若单一文件中选择多个output或选择多个文件进行配置时,需要修改adapter将多个output转换为统一output格式输出给指标。

3.删除数据集时,同时会删除数据源后所有配置(指标、adapter及榜单)

 

步骤四:指标

1.在画布中单击指标卡片,弹出侧边栏

2.单击某个指标,可查看指标详情。也可直接勾选需要的指标

3.当在未找到需要的指标时,在侧边栏下方单击【前往指标库】按钮,创建您所需指标

 

 

步骤五:配置Adapter节点

1.系统已内置基本Adapter,满足以下可跳过配置

文件数 output Adapter
1个文件 1个output ❌已内置,无需手动配置(场景一)
2个文件及以上,且表头相同 1个output ❌已内置,无需手动配置

2.以下情况内置Adapter无法满足,需要您在画布中单击Adapter卡片,在侧边栏中上传配置文件

文件数 output Adapter
1个文件 多个output ✅手动修改配置(场景二)
2个文件及以上,且表头相同 多个output ✅手动修改配置
2个文件及以上,且表头不同 1个output ✅手动修改配置
2个文件及以上,且表头不同 多个output ✅手动修改配置

(1)内置Adapter规则

  • 若使用大模型时,Adapter会将数据自动的转为字符串
  • 若使用小模型时,Adapter会保留数据原有格式

(2)Adapter示例模版为将数据自动的转为字符串,若需要保留数据的原有格式,则执行下方操作:

  • 将文件中片段代码删除
  • 并替换为下方代码片段,即可保留数据原有格式
 dictInfo[column_name] = info[column_name]                                         

(3)内置的Adapter会将所有数据转化为键值对。若不需要键值对数据结构。

  • 将文件如下片段代码删除

  • 并替换为下方代码片段

 

 

步骤六:榜单

1.在画布中单击榜单,弹出侧边栏中配置

(1)均分:所有Task核心指标的平均值

(2)每个Task的核心指标

步骤七:发布

完成以上操作后,右上角单击【发布】,即可完成benchmark配置发布