目录
如果你做短视频时需要配音,但又不想自己录音或者觉得找人配音太贵,TTS-Vue会是一个很顺手的工具。它本质上是一个调用微软语音服务的客户端,但把复杂的接口调用变成了一个清爽的桌面软件。
你只需要把文字贴进去,选一个喜欢的声音——比如晓晓那种自然的中文女声,或者云扬那种沉稳的男声,然后点一下按钮,几秒钟后就能听到合成的语音,满意了就下载成MP3文件。最方便的是它支持超长文本,比如你写了一篇三千字的文案,软件会自动切成小段一段段合成,拼成一个完整的音频,不用你手动分段折腾。
官网入口地址
https://tts-doc.loker.vip/home.html
下载地址
https://tts-doc.loker.vip/guide/install.html
功能介绍
文本转语音核心功能
支持将普通文本直接转换为语音,也支持SSML标记语言。你可以自由调整语音的语言、说话风格、角色人设、语速快慢和音调高低,生成的声音非常接近真人。
批量转换
支持一次性导入多个文本文件进行批量转换。软件会自动处理队列,转换完成后统一输出,适合需要批量生成配音素材的场景。
长文本自动切片
遇到几千字的长文案时,软件会自动将文本切成多个小段,逐个调用语音合成接口,再拼接成一个完整的音频文件。这样就避免了因为文本太长导致转换失败的问题。
声音试听
正式转换之前可以先试听一小段,确认语音风格、语速这些参数合不合适,不满意就现场调整,不用等全部转换完再后悔。
导出为MP3
生成的语音可以直接下载保存为MP3格式,码率和质量都比较均衡,可以直接拖进剪辑软件里用。
日志记录
软件会记录运行过程中的关键信息和报错,如果遇到转换失败或者异常,可以打开日志看看问题出在哪,方便自己排查或者向开发者反馈。
简洁清新的界面
软件界面走的是小清新风格,没有广告、没有弹窗、没有那些乱七八糟的推广入口,用起来很清爽。
多语言和语音风格支持
支持中文普通话、美式英语、英式英语、日语等多种语言。每种语言下又细分了不同的说话风格和角色,比如中文就有晓晓、云扬、晓悠等多个声音可选,有的偏温柔,有的偏活泼。
应用场景
短视频配音:做知识科普、影评解说、故事类短视频,不需要自己录音,直接输入文案生成配音,效率高很多。
广告宣传片旁白:制作产品介绍或者活动宣传视频时,用专业的语音旁白提升整体质感。
有声内容制作:把文章、小说、教程文档转换成音频文件,方便在学习或通勤时听。
在线教育课件:老师制作微课时,用TTS-Vue生成标准清晰的语音讲解,比老师自己录噪音更少、发音更稳定。
游戏视频解说:游戏UP主录制素材后,后期用合成语音加解说,省去录音和降噪的麻烦。
补充信息
定价说明:软件免费,没有任何收费功能或内购。但底层调用的微软语音服务本身有免费额度限制,个人正常使用基本不会超额,重度用户需要留意一下。
开源协议:代码开源托管在GitHub和Gitee上,用户可以自由查看、修改和分发。
系统要求:软件基于Electron构建,支持Windows、macOS和Linux三大主流桌面操作系统。
社区支持:开发者提供了多个QQ反馈群,目前一群到四群都已满员,五群还有位置,遇到问题可以加群寻求帮助。
| 源码反馈/咨询 (共有 条反馈) |
TTS-Vue常见问题
不是公司产品,是个人开发者LokerL做的开源项目。他在Gitee和GitHub上都发布了源码,还建了好几个QQ群用来收集用户反馈,目前一群到四群都已经满人了,看得出用的人还挺多的。
就是一个调用微软语音合成服务的桌面客户端。你不用懂什么API接口、订阅密钥这些东西,打开软件把文字贴进去,选个喜欢的声音,就能生成语音并下载成MP3。特别适合做短视频配音或者有声内容。
从官网下载安装包,装好之后打开软件。界面很简洁,左边一个大文本框把你想要转语音的文字贴进去,右边选语言、选声音角色、调语速和音调。都调好了点右下角的开始转换按钮,等几秒钟就能听到效果,满意的话点下载就行。如果文字很长,软件会自动帮你分段处理。
软件本身免费,代码也是开源的,没有会员也没有内购。不过它背后用的是微软的语音合成服务,微软对个人用户有免费的调用额度,正常做做短视频、配配音是够用的。如果用量特别大,那需要自己去研究微软的付费方案。
作为开源软件,代码是公开的,有没有后门一眼就能看到。而且它不需要联网登录账号,你的文本内容是在本地处理后发到微软接口的,不会经过开发者的服务器。建议只从官方文档里的链接下载,别去第三方网站下,以免下到被篡改的版本。
支持Windows、macOS和Linux。因为它基于Electron框架开发,所以三大主流桌面系统都能用。不同系统的安装包在官方文档的安装页面都能找到。
如果你需要给视频配音或者把文章转成语音,那它挺好用的。的优点就是简单--不用注册、不用看教程、打开就会用。而且微软的声音质量确实不错,尤是中文的晓晓系列,自然度比很多同类产品高。但如果你需要非常精细的语音控制,比如逐字调整音高或者添加复杂的音效,那它不够用,毕竟定位就是轻量工具。
平时不开着不占资源。打开之后占用内存大概一两百兆,合成语音的时候CPU会有一些波动,但持续时间很短,一般几秒到十几秒就完成了。对主流配置的电脑来说基本没感觉,老电脑也能流畅跑。
外语可以,软件支持美式英语、英式英语、日语等。但方言不太行,微软的语音服务本身就不支持粤语、四川话这些方言。另外不同语言下面有不同的声音角色可选,比如英语就有好几种口音和风格。
网页版工具一般需要在线用,每次都得打开浏览器,而且很多有字数限制或者要付费。TTS-Vue是本地软件,打开就能用,不用记网址。最重要的是它支持长文本自动切片,几千字的文章扔进去不用自己分段,这点比大多数网页版方便多了。
你的文本内容只有两个地方会接触到:一个是你自己的电脑,一个是微软的语音合成服务器。开发者LokerL不收集任何数据,软件也不带统计功能。不过如果你处理的是商业机密或者敏感内容,建议了解一下微软服务的数据处理政策,毕竟语音合成需要把文本传给微软。
这个主要取决于微软语音服务的使用条款。个人创作者用于自媒体、短视频是没问题的。但如果你要大规模商用,比如做有声书付费专辑或者电话语音客服系统,建议去查阅微软Azure认知服务的官方许可,或者咨询一下专业人士。软件本身的开源协议不限制你用生成的内容干什么。