OpenVoice：开源即时语音克隆技术-代码号

Name: OpenVoice
Author: 原创

OpenVoice

用户：原创发布日期：2025-10-19 已有人查阅

OpenVoice是一款开源即时语音克隆工具，通过短音频样本即可精准复制音色并生成多语言语音，实现高质量的语音合成效果。

OpenVoice是由MIT和MyShell联合开发的开源语音克隆技术，该技术基于先进的音频基础模型构建。其核心创新在于实现了音色克隆与语音风格的解耦控制，仅需一段短至30秒的参考音频即可准确克隆说话人的音色特征。该技术支持多种语言和口音的语音生成，包括英语、中文、日语、西班牙语等，并能够灵活调节语音的情感、节奏、停顿等风格参数。OpenVoice V2版本进一步提升了音频质量，扩展了多语言支持，并采用MIT开源协议允许免费商用。

官网入口地址

https://research.myshell.ai/open-voice

GitHub地址

项目源码托管于GitHub：https://github.com/myshell-ai/OpenVoice

功能介绍

OpenVoice具备精准的音色克隆能力，能够高度还原参考音频的音色特征。其语音风格控制系统支持情感、口音、语速、停顿等多维度参数调节。零样本跨语言克隆功能允许在没有目标语言训练数据的情况下实现语音转换。多语言原生支持涵盖主流国际语言，确保生成语音的自然度。实时生成能力保证较低的推理延迟，适合交互式应用。开源架构便于研究人员和开发者进行二次开发和定制化改进。