更新时间:2024-05-30 10:51:02

功能概述

储存并管理数据集,可以支持数据集的创建、查看、编辑、删除等功能。数据集可以被用于训练和评估机器学习模型。在数据分析、机器学习、软件开发等场景有很大的作用。数据集中可以包含各种类型的数据,如文本、图像、音频等。

 

前提条件

数据源的准备是至关重要的一步。合适的数据源能够准确模拟实际使用场景,因此数据源的准备需要与指标的输入和输出保持一致,以确保测试的可重复性和可靠性。

 

1.定义测试场景和目标

确定基准测试的具体目标和使用场景,例如评估数据库的查询性能、评测算法的处理效率等。这有助于选择和准备合适的数据源。

 

2.选择数据集

根据测试场景选择合适的数据集。数据集可以来自实际生产环境、公开的基准数据集(如TPC、SPEC等),或者是专门生成的合成数据集。

 

3.数据清洗和预处理

确保数据的质量和一致性,包括去除重复数据、填补缺失值、标准化数据格式等。预处理步骤还可能涉及数据的分类、分组和排序,以便符合测试需求。

 

4.数据规模调整

根据测试需求调整数据集的规模。不同的基准测试可能需要不同规模的数据集,以便测试系统在不同负载下的表现。例如,数据库性能测试可能需要不同数量的记录集。

 

操作指引

1.进入数据集界面。

2.单击【新建】按钮,进入“新建数据集”对话框。

3.在弹出的页面中,填写数据集名称与描述,并单击 【新建】按钮。进入数据集

 

数据集介绍

1.单击【编辑】按钮,用户可通过模板调整数据集描述等

2.单击【新建版本】按钮,创建数据集新版本

 

文件与版本

1.在“文件与版本”板块,单击【上传】按钮,并选择上传类型:文件或文件夹

2.支持.json、.jsonl、.csv和.parquet格式上传到数据集,其中csv文件转义符仅支持\t

3.上传文件成功后,支持用户查看、下载、删除数据

 

设置

1.在“设置”板块

(1)支持编辑数据集名称、描述及颜色。编辑后,单击【确定】按钮,即可完成修改。

(2)单击【删除】按钮,可删除当前数据集

 

删除版本

1.单击【删除版本】按钮,弹出弹窗,选择需要删除的版本进行删除

注意:删除最后一个版本时,系统仅删除内容,不会删除数据集。

 

权限管理

1.单击【权限管理】按钮,在管理列表中可查看分配权限情况

2.在“管理列表”中

(1)单击【添加】按钮添加用户

(2)在列表中勾选查看、编辑、删除、下载文件/文件夹、权限管理5个纬度

(3)完成后,单击【保存】按钮,完成分配