Seed-TTS - 字节跳动推出的文本到语音生成模型

Seed-TTS是由字节跳动推出的一系列大规模自回归文本到语音(TTS)模型，能够生成与人类语音难以区分的语音。它在语音上下文学习、说话人相似度和自然度方面表现出色，通过微调可进一步提升主观评分。Seed-TTS还提供了对情感等语音属性的优越控制能力，并能生成高度表达性和多样性的语音。此外，提出了一种自蒸馏方法用于语音分解，以及一种增强模型鲁棒性、说话人相似度和控制性的强化学习方法。还展示了Seed-TTS模型的非自回归(NAR)变体Seed-TTSDiT，它采用完全基于扩散的架构，不依赖于预先估计的音素持续时间，通过端到端处理进行语音生成。

网站域名：bytedancespeech.github.io 更新日期：2024-06-13 网站简称：Seed-TTS - 字节跳动推出的文本到语音生成模型网站分类：影音视频人气指数：721

前往站点

同分类热门推荐

Reecho睿声 - 超拟真语音合成与瞬时克隆平台

Reecho睿声是一款专注于5秒瞬时语音克隆和超拟真语音合成的创新产品，由自研尖端Reecho文生语音大模型驱动，可深入理解文本，瞬时克隆任意声音，并实现与真人无异的超拟真语音合成效果。

在线免费文字转语音 - TTSMaker官网 | 马克配音

TTSMaker（马克配音）是一个免费的AI配音平台，可以将文本转换成语音，支持50多种语言和300多种语音风格，包括各种热门短视频声音，强大的神经网络使语音听起来更加自然，您可以在线试听，或者按mp3、wav格式下载音频文件。

Buzz 免费离线的语音转文字工具

Buzz 是一款基于 OpenAI Whisper 的开源、可离线的实时语音转文字工具，支持多平台，具有高精度、速度快、多语言等特点，可用于会议记录、音频视频转录等。

极影派

珍藏影片轻松管理

TTS Online 免费的文本转语音工具

TTS Online是一款免费的文本转语音工具，提供语音合成服务，支持多种语言，包括英语、法语、德语、西班牙语、阿拉伯语、中文、日语、韩语等，以及多种语音风格。您可以用它大声朗读文本和电子书。作为一款优秀的免费 TTS 工具，TTS Online可以轻松地将文本在线转换为语音

AI声音克隆 - AnyVoice

仅需3秒即可创建完美的AI声音克隆。采用先进AI技术的超真实声音克隆。