Parler-TTS：一个高质量文本到语音（TTS）模型

Parler-TTS 是一个由 Hugging Face 开发的轻量级文本转语音（TTS）模型，能够以给定说话者的风格（性别、音调、说话风格等）生成高质量、自然 sounding 的语音。它是基于 Dan Lyth 和 Simon King 发表的论文《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》的工作复现，两位作者分别来自 Stability AI 和爱丁堡大学。与其他TTS模型不同，Parler-TTS 完全开源发布，包括数据集、预处理、训练代码和权重。功能包括：生成高质量且自然 sounding 的语音输出、灵活的使用和部署、提供丰富的注释语音数据集。定价：免费。项目地址:https://top.aibase.com/tool/parler-tts 模型下载:https://huggingface.co/parler-tts 在线体验:https://huggingface.co/spaces/parler-tts/parler_tts_mini 需求人群：可用于生成自然 sounding 的语音，定制特定说话者风格，提供丰富的注释语音数据集。使用场景示例：用于定制化说话者风格的语音生成快速部署并使用自然 sounding 的语音输出训练和改进TTS模型的丰富资源产品特色：生成高质量且自然 sounding 的语音输出根据给定说话者的风格进行定制易于使用的安装和部署方法提供开源注释语音数据集

网站域名：github.com 更新日期：2024-04-14 网站简称：Parler-TTS：一个高质量文本到语音（TTS）模型网站分类：影音视频人气指数：785

前往站点

同分类热门推荐

Reecho睿声 - 超拟真语音合成与瞬时克隆平台

Reecho睿声是一款专注于5秒瞬时语音克隆和超拟真语音合成的创新产品，由自研尖端Reecho文生语音大模型驱动，可深入理解文本，瞬时克隆任意声音，并实现与真人无异的超拟真语音合成效果。

腾讯智影

腾讯智影是一款云端智能视频创作工具，集素材搜集、视频剪辑、渲染导出和发布于一体的免费在线剪辑平台。强大的AI智能工具，支持文本配音、数字人播报、自动字幕识别、文章转视频、去水印、视频解说、横转竖等功能，拥有丰富的素材库，极大提升创作效率，帮助用户更好地进行视频化的表达。

在线免费文字转语音 - TTSMaker官网 | 马克配音

TTSMaker（马克配音）是一个免费的AI配音平台，可以将文本转换成语音，支持50多种语言和300多种语音风格，包括各种热门短视频声音，强大的神经网络使语音听起来更加自然，您可以在线试听，或者按mp3、wav格式下载音频文件。

Buzz 免费离线的语音转文字工具

Buzz 是一款基于 OpenAI Whisper 的开源、可离线的实时语音转文字工具，支持多平台，具有高精度、速度快、多语言等特点，可用于会议记录、音频视频转录等。

极影派

珍藏影片轻松管理

TTS Online 免费的文本转语音工具

TTS Online是一款免费的文本转语音工具，提供语音合成服务，支持多种语言，包括英语、法语、德语、西班牙语、阿拉伯语、中文、日语、韩语等，以及多种语音风格。您可以用它大声朗读文本和电子书。作为一款优秀的免费 TTS 工具，TTS Online可以轻松地将文本在线转换为语音