模型接入
模型接入是指将外部的大语言模型(如ChatGPT等)或推理语言模型等相关模型,通过特定的配置和连接方式集成到系统中,使其能够在该系统内被调用和使用。通过模型接入,使自身系统能够进行功能扩展、提升在处理任务上的性能表现以及节省模型开发时间和成本等。
大模型接入
进入模型管理页面,点击后台管理>模型管理>大模型>新建,填写相关配置信息,点击测试连接;如果测试连接成功,点击保存。
参数说明:
›模型类型
-
- 大语言模型(LLM):以海量文本数据训练,具备出色语言处理能力,可用于文本创作、语言翻译等文本处理任务。
- 推理语言模型(RLM):在语言模型基础上强化逻辑推理,适用于数学问题解答、逻辑验证等需深度推理的场景。
- 视觉理解(VU):专注视觉内容分析,能识别物体、场景、行为等,用于图像识别、视频监控分析等场景。
›API Model:用于指定接入模型所对应的特定应用程序接口模型标识,帮助系统准确识别和调用对应的模型服务。
›API URL:模型提供服务的应用程序接口的网络地址,通过该地址系统可以与模型进行数据交互。
-
- AISHU大模型填写格式:http://ip:端口/版本号/chat/completions
- 例如:http://192.xxx.xxx.11:18302/v1/chat/completions
- AISHU大模型填写格式:http://ip:端口/版本号/chat/completions
›鉴权:验证用户或系统是否有权访问模型,保障模型服务安全,防止非法调用。
-
- API Key即应用程序接口密钥,它是服务器用来识别和验证调用API的客户端身份的一种方式。相对简单易用,由于其以明文传输,存在一定的安全风险。
- Dual Key“双密钥”,是一种比单一API Key更安全的鉴权机制。它通常涉及两个不同的密钥,分别用于不同的鉴权阶段或具有不同的权限等场景。安全性更高,其配置和使用相对复杂。
›最大上下文:模型一次能处理的文本长度上限,影响对长文本的理解和处理能力。
›参数量:模型内部可调整参数的数量,体现模型复杂度,参数量大通常能力更强。
大模型其他操作
进入模型管理主页,点击大模型可以进行模型查看、编辑、删除、测试连接等操作;还可以通过模型类型进行筛选,通过模型名称进行搜索。用户还可通过API使用指南,进行API调用或使用SDK进行开发。
小模型接入
进入模型管理页面,点击小模型>新建,填写相关配置信息(以下以选择适配文件的场景来做说明)。点击测试连接;如果测试连接成功,点击保存。
参数说明:
›模型类型
-
-
内置Embedding小模型:提供文本、图片等数据转换为向量表示的能力。
- 内置Reranker小模型:提供对搜索的结果按与问题的相关度重排序的能力。
-
›适配文件:
-
- 注释说明:阐明函数定义规范,包括入口函数名、参数类型及异步要求,为开发者提供使用指引。
- 库导入:引入时间、异步 HTTP 请求、JSON 处理及唯一标识符生成库,为后续功能实现提供基础支持。
- 主函数定义:定义异步主函数,明确接受文本列表参数,作为程序执行的入口点。
- 请求配置:设定服务地址、请求头及请求体,为与 embedding 服务通信做好准备。
- 请求发送与响应处理:利用异步客户端发送请求,检查状态码,成功时解析响应为 JSON 格式。
- 响应体构建:将 embedding 结果封装为标准 openai 风格响应体,涵盖对象、数据、模型等多方面信息。
- 结果返回:把构建好的响应体返回,以便调用者获取并使用 embedding 处理结果。
说明:爱数小模型的常规配置请参考大模型接入配置说明,关于爱数小模型接入的API URL填写格式为:http://ip:端口/版本号/模型类型,示例如下:
- http://192.xxx.xxx.11:18302/v1/embeddings
- http://192.xxx.xxx.11:18302/v1/rerank
小模型其他操作
进入模型管理主页,点击小模型可以进行模型查看、编辑、删除、测试连接等操作;还可以通过模型类型进行筛选,通过模型名称进行搜索。用户还可通过API使用指南,进行API调用。
- 权限管理
进入模型管理主页,点击小模型,可以进行模型权限管理操作。填写好配置内容后,点击确定。
模型授权成功后,自动返回权限管理主页,可查看此模型的权限配置详情。