Parler-TTS 是一个由 Hugging Face 开发的轻量级文本转语音(TTS)模型,能够以给定说话者的风格(性别、音调、说话风格等)生成高质量、自然 sounding 的语音。它是基于 Dan Lyth 和 Simon King 发表的论文《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》的工作复现,两位作者分别来自 Stability AI 和爱丁堡大学。与其他TTS模型不同,Parler-TTS 完全开源发布,包括数据集、预处理、训练代码和权重。功能包括:生成高质量且自然 sounding 的语音输出、灵活的使用和部署、提供丰富的注释语音数据集。定价:免费。 项目地址:https://top.aibase.com/tool/parler-tts 模型下载:https://huggingface.co/parler-tts 在线体验:https://huggingface.co/spaces/parler-tts/parler_tts_mini 需求人群: 可用于生成自然 sounding 的语音,定制特定说话者风格,提供丰富的注释语音数据集。 使用场景示例: 用于定制化说话者风格的语音生成 快速部署并使用自然 sounding 的语音输出 训练和改进TTS模型的丰富资源 产品特色: 生成高质量且自然 sounding 的语音输出 根据给定说话者的风格进行定制 易于使用的安装和部署方法 提供开源注释语音数据集

网站域名:github.com 更新日期:2024-04-14 网站简称:Parler-TTS:一个高质量文本到语音(TTS)模型 网站分类:影音视频 人气指数:92