AnyShare Family 7 AI实验室基于本地AI模型实现,当前开放的自动语音识别ASR(Automatic Speech Recognition)能力提供了文件转文字、实时录音两大功能,帮助您高效处理音视频文件,将语音信息转为可编辑、可探索的文本数据,提升信息处理及利用效率,助力智能化办公与创作。
功能说明
文件转文字:音视频文件转文字、AI 总结、多格式导出、字幕烧录等功能。适用于视频字幕自动化生成,视频脚本自动化还原,培训、会议、访谈等各类工作场合录音文件的转写,个人知识整理,资料整理等场景。
实时录音:语音输入实时转文字、AI 总结、多格式导出,适用于实时采访、会议、商务谈判、培训、课堂笔记转录以及跨语言实时沟通等多种实时口述转录场景。
产品版本要求
AnyShare 7.0.6.4版本后,方可支持AI实验室功能。
环境要求
本功能基于Apple芯片实现,因此对设备环境有以下要求:
1)需为搭载M1-M4芯片的Mac设备;
2)操作系统要求macOS 14+
访问AI实验室
AI实验室入口
点击托盘菜单中的“AI实验室”。
点击后,方可进入AI实验室功能界面。您可以点击”设置”,预先完成依赖模型、第三方集成等的配置后,再进行功能使用。
完成依赖配置后,您可以点击”文件转文字”上传音视频文件,将语音内容转换为可编辑文本,对其进行文本总结;也可以开启实时录音转写,即时获取语音转文本结果。
配置功能依赖
配置入口
入口一:点击托盘菜单中的“云盘设置”,切换到“模型管理”、“第三方集成”进行配置。
入口二:点击托盘菜单中的“AI实验室”,点击右上角“设置”即可。
模型配置
当前提供Tiny(66.74 MB)、Base(127.18 MB)、Small(425.76 MB)、Medium(821.3 MB)、Large(1.39 GB)五种模型。模型效果上,模型越大,转写速度越慢,转写效果越好。
如何获取模型?
模型同AnyShare客户端安装包一并归档发布。考虑到用户可能所处内网环境,所以您需要联系系统管理员获取模型压缩包,并下载至本地。
如何导入模型?
将模型压缩包下载至本地后,需要将模型导入到配置中。进入依赖配置界面,点击【导入】,在弹窗中选择所需的模型压缩包,点击【导入】即可。
完成导入的模型名称后有“”标识,供您使用。点击“
”,您可以清理不需要的模型。
第三方服务集成
三方集成主要用来实现转写后文本的二次总结,方便快速提炼出核心内容。目前支持OpenAI兼容的服务商,如ChatGPT、DeepSeek、硅基流动、阿里云百炼等平台。配置步骤如下:
注意:此功能需联网使用。
进入依赖配置界面,点击并切换到“三方集成”配置窗口。点击右上角【添加】按钮,配置并添加新的服务。
您可以自定义服务名称,填写从第三方服务商处获取的基础URL和API密钥(各平台服务的获取方式不同,在此处不展示获取入口),填写并验证通过后,点击选择模型,模型选择完成后会显示为服务的可用状态。
注意:使用总结功能时,需要特别注意所选模型本身需要支持文本总结功能。
三方集成配置项说明:
切换选择模型:
服务可用状态:
音视频文字转写
1. 选择转写文件
点击“文件转文字”,在文件选择弹窗中选择需转写的音/视频文件(默认从 AnyShare 选择文件),也可以选择其他位置文件。
注意:当前支持转写的文件格式类型如下:
1)支持的音频文件格式:WAV、MP3、OGG、FLAC、AAC、M4A、WMA;
2)支持的视频文件格式:MP4(提取音频部分)。
2. 配置转写模型及语言
用户根据需要选择模型和源语言后,点击【开始】,即可触发转写。
3. 修订转写文本
转写的准确率由模型决定,存在一定的偏差,在转写完成后,您可以进一步对转写后的文本进行编辑调整。
4. AI总结转写内容
当第三方服务可用时,可以在转写完成后对内容进行 AI 总结,方便快速获取核心内容。
若您对总结的内容不满意,可以进入会话模式,提出修改要求后,方可重新总结。
5. 导出文本
所有工作完成后,点击【导出】保存转写内容,当前支持多种保存格式,包括:TXT、SRT(视频字幕)、LRC、VTT(字幕文件)等,您也可以直接保存为音频、视频文件。
选择导出为视频时,需注意“字幕方式”的选择。当选择“烧录到视频”,会将字幕添加到视频上。
实时录音转写
1. 配置转写模型及语言
点击“实时录音”后,按需选择模型、源语言(支持自动检测)、麦克风后,即可进入。
2. 开启录音,实时转写
模型加载完成后,点击“开始录音“图标,即可触发转写。
3. 修订转写文本
转写的准确率由模型决定,存在一定的偏差,在转写完成后,您可以进一步对转写后的文本进行编辑调整。
4. AI总结转写内容
当第三方服务可用时,可以在转写完成后对内容进行 AI 总结,方便快速获取核心内容。
如果对总结的内容不满意可以进入会话模式提出要求便于重新总结。
5. 导出文本
所有工作完成后,点击【导出】保存转写内容,当前支持多种保存格式,包括:TXT、SRT(视频字幕)、LRC、VTT(字幕文件)等。