影音视频

VPot-Web 免费无广的文字转语音的工具

VPot(详情请戳 官网)是一款免费无广的文字转语音的工具,内置多语种多声音角色,可将任意文字内容转换为流畅的语音文件,完全调用微软及edge公共API接口,纯CPU处理,适用于譬如短视频配音、教学平台、有声读书等各种应用场景。如侵请删~~~ 虽然这类软件多的是,尤其是在线网页版确实不计其数,缺点都是限制字数的居多,不排除要登录及限制次数的可能。另外,某些真人克l类TTS也相当成熟,无奈老旧系统无缘,但这些均不在本帖讨论及推荐范围之内。 而此款并无以上束缚,u1s1这么多厂商的TTS当中唯有微软TTS的声音合成算是yyds,简洁而无登录接口,不限次数不限字数,实现不失真全输出,支持 win 7 – 11 64位系统 。近期更新,有需自取~~~ 软件特点: 1. 支持导入txt、srt字幕文件; 2. 实现音频文件管理,方便反复试听和对比; 3. 现可自选音频保存目录; 4. 保留超长文本转录的可行性; 5. 文件重命名不再受软件影响。 使用说明: 单文件版即开即用即删,ctrl + v 粘贴对应的文字,合成语音成功后会自动弹出输出的音频结果。常用语种识别包括但不限于普通话、粤语、港普、台语、日韩马来等等,前提是部分外语文字要相应匹配。所以一般而言公共接口已经可以满足日常的转录使用了。文本越长,合成处理自然越久。 若是使用 win 7 及精简版系统,需到微软官方安装 > > Webview2 依赖环境才能玩。不排除可能还需要常用C++运行库的加持,论坛多的是,善用搜索功能便能找到。 另外,如果想要更多语种识别多角色演绎且会折腾的,则需自行到 > > 微软Azure 申请免费api自行导入,教程在小破站随处可见,具体自行搜索即可。 况且可直接录制对应的报时声音,可用于某些语音报时工具,如 > > 自动化任务工具(选定“报时”任务,音频默认放在对应的Data——Sound目录文件夹内,直接对应替换原始音频的文件命名及格式)

vivo听说

vivo听说是一款免费无广由vivo大厂开发的实时语音转文字及文字播报工具,以对话方式输出呈现,支持普通话、方言及英文语种的识别,实现无障碍沟通,适合对方无法倾听或诉说以及会议记录等应用场景。原先这个功能仅开放给自家品牌系统使用,如今已经下放成为独立APP产品便于用户共享。 虽说这类语音转文字的现成软件已经到处都是,无非是会员登录制、识别字符限制及无限弹广告的各种套路居多,不仅ex特烦且体验实在一言难尽。另外PC版的也遍地都是,故这类情况的工具均不在本帖的推荐范围之内。 此版本为手机通用版,均无上述情形,即不限制机型,简洁且清爽,无登录接口,识别率较高,功能无限制(包括转录时长及字符数)。简言之,可当作一款语音转文字工具+方言翻译器。有需自取~~~ 软件特点: 1. 实时语音转文字:一键启动随录随停,AI智能语法断句加标点,实时将语音转换为文字,方便获取信息。 2. 一键语音播报:输入文本一键播报,方便传达他人及用于文字转语音。 3. 超拟人音色:选择自然真实的音色,提升语音播报效果。 4. 文字放大及镜像反转:双击文本可放大可反转,方便他人浏览。 5. 快捷短语:常用短语设置为快捷方式,轻松表达。 6. 字体大小调节:可调节字体大小,提升可读性。 7. 方言识别:目前支持包括粤语、四川话、济南话、河南话、武汉话等部分地区语种识别。 *支持Android 10 - 15的安卓系统,兼容澎湃及鸿蒙系统(至于鸿蒙Next系统侧载兼容性未知则自行测试) 使用说明: 至于无限制的文字转语音软件,可转至请戳 > > 此工具。 首次使用有详细的说明引导。可能需给予录音等权限(至于具体需要获取什么权限及相关隐私内容,软件的使用协议已经罗列得一清二楚,请自行阅读)。 底部可转录可输入,长按已转录文字可标注、复制、多选等,双击可镜像倒立放大,输入文字后点击可发声朗读;右上角齿轮可设置音色、方言语种识别等;若想要随时自由切换普通话及方言语种的,请设置为方言识别即可。其余功能自行体验~~~ PS: 1. 本软件目前已有上架部分国内市场,自然是已经通过安全检测,此处仅作分流及旧版备份之用。另因完全依赖在线且采取即录即转功能,故安装包没有很大,介意的勿下勿用,嫌弃的推荐卸载并转用其它工具~~~ 2. 可能因低版本的安卓系统处理算力环境不够(跟低版本PC无法运行部分智能产品一个道理),故基本淘汰六七年前过老的系统机型。其次,此处的音色仅为蓝厂自带提供;而此处的方言识别是对所说的方言翻译并转为通俗易懂的简明版文字,类似观看的直白口语化字幕,并非微信那种的直译(粤)式文字转录且后期还要处理的形式。目前新版本不影响旧版本的使用。 3. 另提一下,实时转录采集声音时要想识别精确的话建议保持该软件独占扬声器、语速不宜过快且处于相对安静的无过多背景音环境,即不要外放音乐或其它app上的声音。并不是不行,只是识别效果不太好而已。偏门点的语音不排除偶尔抽风的情况,清除缓存重试即可,各位自行衡量~~~


友情链接