功能概述
储存并管理数据集,可以支持数据集的创建、查看、编辑、删除等功能。数据集可以被用于训练和评估机器学习模型。在数据分析、机器学习、软件开发等场景有很大的作用。数据集中可以包含各种类型的数据,如文本、图像、音频等。
前提条件
数据集的准备是至关重要的一步。合适的数据集能够准确模拟实际使用场景,因此数据集的准备需要与指标的输入和输出保持一致,以确保测试的可重复性和可靠性。
1.定义测试场景和目标
确定基准测试的具体目标和使用场景,例如评估数据库的查询性能、评测算法的处理效率等。这有助于选择和准备合适的数据集。
2.选择数据集
根据测试场景选择合适的数据集。数据集可以来自实际生产环境、公开的基准数据集(如TPC、SPEC等),或者是专门生成的合成数据集。
3.数据清洗和预处理
确保数据的质量和一致性,包括去除重复数据、填补缺失值、标准化数据格式等。预处理步骤还可能涉及数据的分类、分组和排序,以便符合测试需求。
4.数据规模调整
根据测试需求调整数据集的规模。不同的基准测试可能需要不同规模的数据集,以便测试系统在不同负载下的表现。例如,数据库性能测试可能需要不同数量的记录集。
操作指引
1.进入数据管理,在左侧页面菜单栏选择“数据集”,进入“数据集”页面。
2.单击【新建】按钮,进入“新建数据集”对话框。
3.在弹出的页面中,填写数据集名称、描述和csv文件解析分隔符,并单击 【新建】按钮。进入数据集
数据集介绍
1.单击【编辑】按钮,用户可通过模板调整数据集描述等
2.单击【新建版本】按钮,创建数据集新版本
文件与版本
1.在“文件与版本”板块,单击【上传】按钮,并选择上传类型:文件或文件夹
2.支持.json、.jsonl、.csv和.parquet格式上传到数据集,其中csv文件转义符支持根据用户自定义
3.上传文件成功后,支持用户查看、下载、删除数据
设置
1.在“设置”板块
(1)支持编辑数据集名称、描述及颜色。编辑后,单击【确定】按钮,即可完成修改。
(2)单击【删除】按钮,可删除当前数据集
删除版本
1.单击【删除版本】按钮,弹出弹窗,选择需要删除的版本进行删除
注意:删除最后一个版本时,系统仅删除内容,不会删除数据集。
权限管理
1.单击【权限管理】按钮,在管理列表中可查看分配权限情况
2.在“管理列表”中
(1)单击【添加】按钮添加用户
(2)在列表中勾选查看、编辑、删除、下载文件/文件夹、权限管理5个纬度
(3)完成后,单击【保存】按钮,完成分配