更新时间:2025-05-27 17:11:14

AnyShare Family 7 AI实验室基于本地AI模型实现,当前开放的自动语音识别ASR(Automatic Speech Recognition)能力提供了文件转文字、实时录音两大功能,帮助您高效处理音视频文件,将语音信息转为可编辑、可探索的文本数据,提升信息处理及利用效率,助力智能化办公与创作。

功能说明

文件转文字:音视频文件转文字、AI 总结、多格式导出、字幕烧录等功能。适用于视频字幕自动化生成,视频脚本自动化还原,培训、会议、访谈等各类工作场合录音文件的转写,个人知识整理,资料整理等场景。

实时录音:语音输入实时转文字、AI 总结、多格式导出,适用于实时采访、会议、商务谈判、培训、课堂笔记转录以及跨语言实时沟通等多种实时口述转录场景。

产品版本要求

AnyShare 7.0.6.4版本后,方可支持AI实验室功能。

环境要求

本功能基于Apple芯片实现,因此对设备环境有以下要求:

1)需为搭载M1-M4芯片的Mac设备;

2)操作系统要求macOS 14+

访问AI实验室

AI实验室入口

点击托盘菜单中的“AI实验室”。

点击后,方可进入AI实验室功能界面。您可以点击”设置”,预先完成依赖模型、第三方集成等的配置后,再进行功能使用。

完成依赖配置后,您可以点击”文件转文字”上传音视频文件,将语音内容转换为可编辑文本,对其进行文本总结;也可以开启实时录音转写,即时获取语音转文本结果。

配置功能依赖

配置入口

入口一:点击托盘菜单中的“云盘设置”,切换到“模型管理”、“第三方集成”进行配置。

入口二:点击托盘菜单中的“AI实验室”,点击右上角“设置”即可。

模型配置

当前提供Tiny(66.74 MB)、Base(127.18 MB)、Small(425.76 MB)、Medium(821.3 MB)、Large(1.39 GB)五种模型。模型效果上,模型越大,转写速度越慢,转写效果越好。

如何获取模型?

模型同AnyShare客户端安装包一并归档发布。考虑到用户可能所处内网环境,所以您需要联系系统管理员获取模型压缩包,并下载至本地。

如何导入模型?

将模型压缩包下载至本地后,需要将模型导入到配置中。进入依赖配置界面,点击【导入】,在弹窗中选择所需的模型压缩包,点击【导入】即可。

完成导入的模型名称后有“”标识,供您使用。点击“”,您可以清理不需要的模型。

第三方服务集成

三方集成主要用来实现转写后文本的二次总结,方便快速提炼出核心内容。目前支持OpenAI兼容的服务商,如ChatGPT、DeepSeek、硅基流动、阿里云百炼等平台。配置步骤如下:

注意:此功能需联网使用。

进入依赖配置界面,点击并切换到“三方集成”配置窗口。点击右上角【添加】按钮,配置并添加新的服务。

您可以自定义服务名称,填写从第三方服务商处获取的基础URL和API密钥(各平台服务的获取方式不同,在此处不展示获取入口),填写并验证通过后,点击选择模型,模型选择完成后会显示为服务的可用状态。

注意:使用总结功能时,需要特别注意所选模型本身需要支持文本总结功能。

三方集成配置项说明:

切换选择模型:

服务可用状态:

音视频文字转写

1. 选择转写文件

点击“文件转文字”,在文件选择弹窗中选择需转写的音/视频文件(默认从 AnyShare 选择文件),也可以选择其他位置文件。

注意:当前支持转写的文件格式类型如下:

1)支持的音频文件格式:WAV、MP3、OGG、FLAC、AAC、M4A、WMA;

2)支持的视频文件格式:MP4(提取音频部分)。

2. 配置转写模型及语言

用户根据需要选择模型和源语言后,点击【开始】,即可触发转写。

3. 修订转写文本

转写的准确率由模型决定,存在一定的偏差,在转写完成后,您可以进一步对转写后的文本进行编辑调整。

4. AI总结转写内容

当第三方服务可用时,可以在转写完成后对内容进行 AI 总结,方便快速获取核心内容。

若您对总结的内容不满意,可以进入会话模式,提出修改要求后,方可重新总结。

5. 导出文本

所有工作完成后,点击【导出】保存转写内容,当前支持多种保存格式,包括:TXT、SRT(视频字幕)、LRC、VTT(字幕文件)等,您也可以直接保存为音频、视频文件。

选择导出为视频时,需注意“字幕方式”的选择。当选择“烧录到视频”,会将字幕添加到视频上。

实时录音转写

1. 配置转写模型及语言

点击“实时录音”后,按需选择模型、源语言(支持自动检测)、麦克风后,即可进入。

2. 开启录音,实时转写

模型加载完成后,点击“开始录音“图标,即可触发转写。

3. 修订转写文本

转写的准确率由模型决定,存在一定的偏差,在转写完成后,您可以进一步对转写后的文本进行编辑调整。

4. AI总结转写内容

当第三方服务可用时,可以在转写完成后对内容进行 AI 总结,方便快速获取核心内容。

如果对总结的内容不满意可以进入会话模式提出要求便于重新总结。

5. 导出文本

所有工作完成后,点击【导出】保存转写内容,当前支持多种保存格式,包括:TXT、SRT(视频字幕)、LRC、VTT(字幕文件)等。