更新时间:2024-04-15 16:35:44

用于创建并运行评估算法性能的任务,并记录相关性能指标。

 

定义

算法:在Benchmark任务中,算法为大模型(结合提示词)、小模型、应用。

 

操作指引

功能 说明 详细指导
新建Benchmark任务 创建评估算法性能的任务 详情
编辑Benchmark任务 创建任务后,编辑任务,更新任务信息 详情
运行Benchmark任务 创建任务后,运行任务,查看运行状态及日志 详情
查看Benchmark任务 创建任务后,预览任务内容 详情
查看Benchmark任务结果 创建并运行任务后,查看任务结果 详情
删除Benchmark任务 删除已创建的任务,以适应业务变化 详情