智谱开源GLM-TTS语音模型：3 秒复刻人声，支持多情感表达！

在这里插入图片描述 GLM-TTS是基于大语言模型的高质量文本转语音（TTS）合成系统，支持零样本语音克隆和流式推理。该系统采用两阶段架构，结合了用于生成语音标记的大语言模型（LLM）和用于波形合成的流匹配模型。通过引入多奖励强化学习框架，GLM-TTS显著提升了生成语音的表现力，相比传统TTS系统实现了更自然的情感控制。核心特性零样本语音克隆：仅需3-10秒提示音频即可克隆任意说话者音色强化学习增强的情感控制：采用多奖励强化学习框架（GRPO）优化韵律和情感表达高质量合成：生成语音质量媲美商业系统，同时降低字符错误率（CER）音素级控制：支持"混合音素+文本"输入，实现精准发音控制（如多音字）流式推理：支持实时音频生成，适用于交互式应用场景双语支持：针对中英文混合文本进行优化

网站域名：github.com 更新日期：2025-12-12 网站简称：智谱开源GLM-TTS语音模型：3 秒复刻人声，支持多情感表达！网站分类：影音视频人气指数：468

前往站点

同分类热门推荐

Reecho睿声 - 超拟真语音合成与瞬时克隆平台

Reecho睿声是一款专注于5秒瞬时语音克隆和超拟真语音合成的创新产品，由自研尖端Reecho文生语音大模型驱动，可深入理解文本，瞬时克隆任意声音，并实现与真人无异的超拟真语音合成效果。

在线免费文字转语音 - TTSMaker官网 | 马克配音

TTSMaker（马克配音）是一个免费的AI配音平台，可以将文本转换成语音，支持50多种语言和300多种语音风格，包括各种热门短视频声音，强大的神经网络使语音听起来更加自然，您可以在线试听，或者按mp3、wav格式下载音频文件。

Buzz 免费离线的语音转文字工具

Buzz 是一款基于 OpenAI Whisper 的开源、可离线的实时语音转文字工具，支持多平台，具有高精度、速度快、多语言等特点，可用于会议记录、音频视频转录等。

极影派

珍藏影片轻松管理

TTS Online 免费的文本转语音工具

TTS Online是一款免费的文本转语音工具，提供语音合成服务，支持多种语言，包括英语、法语、德语、西班牙语、阿拉伯语、中文、日语、韩语等，以及多种语音风格。您可以用它大声朗读文本和电子书。作为一款优秀的免费 TTS 工具，TTS Online可以轻松地将文本在线转换为语音

AI声音克隆 - AnyVoice

仅需3秒即可创建完美的AI声音克隆。采用先进AI技术的超真实声音克隆。