睿智导航 - 我的效率工具

珍藏影片轻松管理

背景音乐合成助手 - 背景音乐合成软件，给录音添加背景音乐，背景音乐和语音/音频/MP3文件混音穿插制作语音广告

背景音乐合成助手官网，背景音乐合成软件，给录音添加背景音乐的软件，背景音乐和语音/音频/MP3文件混音穿插制作语音广告。合成参数包括：语音文件、音乐文件、语音音量、语音循环次数、语音每次间隔、音乐音量、音乐提前播、音乐延后播、交叉时音乐减弱、结尾追加空白等。

tts-vue微软语音合成工具

🎤 微软语音合成工具，使用 Electron + Vue + ElementPlus + Vite 构建，将文字转为语音MP3。

视频翻译配音工具 | 视频翻译配音工具

免费开源使用简单的视频翻译和配音工具

OpenCut: 一个开源的CapCut(剪影)替代品

OpenCut是一个开源视频编辑器，作为CapCut(剪影)的免费替代品，重点关注隐私和简单性。它设计用于网络，桌面和移动平台，确保用户的视频保留在他们的设备上，避免了与云上传相关的隐私问题。OpenCut因提供一系列高级功能而引人注目，无需付费，包括基于时间线的编辑，多轨道支持和实时预览，所有这些都没有水印或订阅费用。该项目的结构便于贡献，对于有兴趣增强其功能的开发人员，提供了明确的指导方针，特别是在时间线功能和UI改进等领域。OpenCut根据MIT许可证授权，表明其对开源社区的承诺，并得到了Vercel和fal.ai等知名科技实体的支持

MeloTTS: 开源文本转语音工具

MeloTTS是一个可以把文字转换成声音的工具，它支持英语、西班牙语、法语、中文、日语和韩语等多种语言。它可以让你听到不同的语言和口音，比如美式英语、英式英语、印度英语、澳大利亚英语等。它还可以调节语速，让声音快速或慢速地说出来。它的声音非常自然和流畅，就像真人在说话一样。

在线免费文字转语音 - TTSMaker官网 | 马克配音

TTSMaker（马克配音）是一个免费的AI配音平台，可以将文本转换成语音，支持50多种语言和300多种语音风格，包括各种热门短视频声音，强大的神经网络使语音听起来更加自然，您可以在线试听，或者按mp3、wav格式下载音频文件。

免费在线文字转语音 – NowVoice

400+ AI 音色免费在线文字转语音，无需注册，无限次生成。支持视频配音、短视频解说、广告旁白，一键生成高清 MP3。

文本转语音软件 Balabolka

Balabolka是一个文本转语音（TTS）的程序。Balabolka可以使用计算机系统上安装的所有语音。屏幕上的文字可以被保存为一个WAV，MP3，OGG或者WMA文件。该软件可以读取剪贴板的内容，可以查看AZW，AZW3，CHM，DjVu，DOC，EML，EPUB，FB2，FB3，LIT，MD，MOBI，ODP，ODS，ODT，PDB，PDF，PPT，PRC，RTF，TCR，WPD，XLS和HTML文件中的文本，可自定义字体和背景颜色，控制从系统托盘阅读或者使用热键。 Balabolka使用微软的语音API（SAPI）的各种版本，它可以改变语音的参数，包括语度和语调。用户可以应用特殊的替代清单，以提高语音的清晰度质量。当你想改变的单词拼写时这个功能就非常有用。纠正发音规则使用regexp的语法

TTS Online 免费的文本转语音工具

TTS Online是一款免费的文本转语音工具，提供语音合成服务，支持多种语言，包括英语、法语、德语、西班牙语、阿拉伯语、中文、日语、韩语等，以及多种语音风格。您可以用它大声朗读文本和电子书。作为一款优秀的免费 TTS 工具，TTS Online可以轻松地将文本在线转换为语音

Buzz 免费离线的语音转文字工具

Buzz 是一款基于 OpenAI Whisper 的开源、可离线的实时语音转文字工具，支持多平台，具有高精度、速度快、多语言等特点，可用于会议记录、音频视频转录等。

Reecho睿声 - 超拟真语音合成与瞬时克隆平台

Reecho睿声是一款专注于5秒瞬时语音克隆和超拟真语音合成的创新产品，由自研尖端Reecho文生语音大模型驱动，可深入理解文本，瞬时克隆任意声音，并实现与真人无异的超拟真语音合成效果。

Open Voice:一款可定制声音的开源音频克隆工具

OpenVoice是开源的一款基于人工智能技术的AI语音克隆工具。不仅能够复制和模仿特定人的声音，而且还能模仿他们的语调、语速和语音节奏，从而使得生成的语音几乎与真人无异。一键部署安装包百度网盘下载地址：链接：https://pan.baidu.com/s/16pOxKHsF4EFsLroqRYM_3w?pwd=wj6s 提取码: wj6s 一键部署安装包较大，下载需要一定时间，请耐心等待下载。一键运行下载完成后，点击文件中的run.bat直接一键运行运行完成后，即完成本地化OpenVoice安装。

Parler-TTS：一个高质量文本到语音（TTS）模型

Parler-TTS 是一个由 Hugging Face 开发的轻量级文本转语音（TTS）模型，能够以给定说话者的风格（性别、音调、说话风格等）生成高质量、自然 sounding 的语音。它是基于 Dan Lyth 和 Simon King 发表的论文《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》的工作复现，两位作者分别来自 Stability AI 和爱丁堡大学。与其他TTS模型不同，Parler-TTS 完全开源发布，包括数据集、预处理、训练代码和权重。功能包括：生成高质量且自然 sounding 的语音输出、灵活的使用和部署、提供丰富的注释语音数据集。定价：免费。项目地址:https://top.aibase.com/tool/parler-tts 模型下载:https://huggingface.co/parler-tts 在线体验:https://huggingface.co/spaces/parler-tts/parler_tts_mini 需求人群：可用于生成自然 sounding 的语音，定制特定说话者风格，提供丰富的注释语音数据集。使用场景示例：用于定制化说话者风格的语音生成快速部署并使用自然 sounding 的语音输出训练和改进TTS模型的丰富资源产品特色：生成高质量且自然 sounding 的语音输出根据给定说话者的风格进行定制易于使用的安装和部署方法提供开源注释语音数据集

clone-voice: 一个带web界面的声音克隆工具

Clone-voice是一款Web 界面的声音克隆工具。可使用任何人类音色，将一段文字合成为使用该音色说话的声音，或者将一个声音使用该音色转换为另一个声音。遵守Coqui Public Model License开源协议（作者自己编写的开源协议）。Clone-voice使用简单，没有N卡GPU也可以使用，下载预编译版本，双击 app.exe 打开一个web界面，鼠标点点就能用。支持中、英、日、韩、法、德、意等16种语言，可在线从麦克风录制声音。为保证合成效果，建议录制时长5秒到20秒，发音清晰准确，不要存在背景噪声。作者表示英文效果很棒，中文效果还凑合。

GPT-SoVITS-WebUI: 一键部署，目前最好的中文声音克隆工具

在人工智能的浪潮中，语音技术的革新正以前所未有的速度推进。GPT-SoVITS-WebUI正引领着这一变革。它可以用非常少的声音源快速地训练出一个TTS模型。这个强大的Web界面工具不仅提供了零次学习和少量次学习的文本到语音（TTS）功能，还支持跨语言的语音转换，为语音技术的爱好者和开发者打开了一扇新的大门。功能亮点： 1.零次TTS：只需输入一段5秒的语音样本，GPT-SoVITS-WebUI就能立即将其转换为文本，让你体验到即时的语音到文本的转换。 2.少次TTS：通过微调模型，只需1分钟的训练数据，就能显著提升语音的相似度和真实感，这对于个性化语音合成尤为关键。 3.跨语言支持：GPT-SoVITS-WebUI能够处理与训练数据集不同语言的语音，目前支持英语、日语和中文，这大大拓宽了其应用范围。 4.WebUI工具集成：工具中集成了多种实用功能，如语音伴奏分离、自动训练集分割、中文自动语音识别（ASR）和文本标注，这些工具对于初学者来说尤其友好，可以帮助他们轻松创建训练数据集和GPT/SoVITS模型。

Text to Speech 免费在线文本转语音服务

先进的文本转语音工具所生成的逼真音频。轻松生成和下载高质量音频，满足您的不同需求。

分离人声[AI]

移除人声并隔离用强大的人工智能算法将声音从音乐中分离出来

Screen To Gif

Screen to Gif，最好用的免费开源Gif动画录制工具。小巧原生单执行文件，功能很实用，它有录制屏幕、录制摄像头、录制画板、图像编辑器等功能，可以将屏幕任何区域及操作过程录制成GIF格式的动态图像，保存前还可对GIF图像编辑优化。支持自定义增减重复帧数、调整循环播放次数、调整播放速度及删除重复帧。

lx-music-desktop: 洛雪音乐

落雪音乐官方版免费版提供了非常多的免费音乐资源,在落雪音乐官方版免费版中你可以在线自由收听任何一首自己喜欢的音乐,该应用支持下载高品质及无损音乐,歌曲默认下载到桌面,可自...

免费的在线视频编辑器 | Clipchamp - 快速、易用

微软免费的在线视频编辑器 | Clipchamp - 快速、易用使用我们的视频编辑平台轻松快捷创作视频吧。您可以使用视频模板开始制作，也可以使用网络摄像头或屏幕录制的素材。我们提供滤镜、转场和文本等多种功能，助您打造专业的视频。最后您仅需几分钟即可导出视频并快速分享。

OBS| 开源免费视频直播录制软件

OBS Studio是一款非常专业的视频直播录制软件，完全免费，OBS Studio本身内置了一些常用的插件，如窗口捕获、视频捕获设备、文本、图像、媒体源等。　　具有全面的功能集和更强大的API。可用于Windows，Mac和Linux的版本，在录屏软件中应该是属于专业的水平。

ChatTTS: 语气韵律媲美真人的开源TTS模型,文字转语音界的新魁首,对标微软Azure-tts

ChatTTS 是专为 LLM 助手等对话场景设计的文本转语音模型。它支持英文和中文。

ChatTTS-ui: 匹配ChatTTS的web界面和api接口

匹配ChatTTS的web界面和api接口. ChatTTS-ui提供了网页中使用 ChatTTS 合成语音及 API 接口服务，支持 Windows、Linux、macOS 部署。其中 Windows 用户可直接下载安装包，一键安装开箱即用！

Seed-TTS - 字节跳动推出的文本到语音生成模型

Seed-TTS是由字节跳动推出的一系列大规模自回归文本到语音(TTS)模型，能够生成与人类语音难以区分的语音。它在语音上下文学习、说话人相似度和自然度方面表现出色，通过微调可进一步提升主观评分。Seed-TTS还提供了对情感等语音属性的优越控制能力，并能生成高度表达性和多样性的语音。此外，提出了一种自蒸馏方法用于语音分解，以及一种增强模型鲁棒性、说话人相似度和控制性的强化学习方法。还展示了Seed-TTS模型的非自回归(NAR)变体Seed-TTSDiT，它采用完全基于扩散的架构，不依赖于预先估计的音素持续时间，通过端到端处理进行语音生成。

Gif123:极简 GIF 录屏工具

极简 GIF 录屏工具，可一键快速复制 GIF 图像并直接粘贴到其他程序。支持粘贴到本地文件、QQ、微信、Word、浏览器编辑器（支持公众号、头条编辑器）。可避免无法预览、无效图像、变静态图等常见的兼容问题。原来在公众号编辑器里写文章，可能需要录屏->压缩->保存->添加图像->上传->插入文章 …… 现在用 Gif123 只要 Ctrl +Ｖ一下就全部完成了。

【青森】休闲音乐厅

【青森】休闲音乐厅,无损车载音乐

F5-TTS: Official code for "F5-TTS: A Fairytaler that Fakes Fluent and Faithful Speech with Flow Matching"

Official code for "F5-TTS: A Fairytaler that Fakes Fluent and Faithful Speech with Flow Matching" - SWivid/F5-TTS

度加剪辑-百度官方出品-口播自媒体必备剪辑工具-专为知识创作者而作

度加剪辑旨在打造简洁、好用的视频剪辑工具，致力于降低泛知识类作者的创作门槛，助力生产优质的作品。度加剪辑拥有简单好用的剪辑能力，高效准确的智能识别字幕能力，并且与百度网盘打通，支持下载并导入您的网盘素材。

vivo听说

vivo听说是一款免费无广由vivo大厂开发的实时语音转文字及文字播报工具，以对话方式输出呈现，支持普通话、方言及英文语种的识别，实现无障碍沟通，适合对方无法倾听或诉说以及会议记录等应用场景。原先这个功能仅开放给自家品牌系统使用，如今已经下放成为独立APP产品便于用户共享。虽说这类语音转文字的现成软件已经到处都是，无非是会员登录制、识别字符限制及无限弹广告的各种套路居多，不仅ex特烦且体验实在一言难尽。另外PC版的也遍地都是，故这类情况的工具均不在本帖的推荐范围之内。此版本为手机通用版，均无上述情形，即不限制机型，简洁且清爽，无登录接口，识别率较高，功能无限制（包括转录时长及字符数）。简言之，可当作一款语音转文字工具+方言翻译器。有需自取~~~ 软件特点： 1. 实时语音转文字：一键启动随录随停，AI智能语法断句加标点，实时将语音转换为文字，方便获取信息。 2. 一键语音播报：输入文本一键播报，方便传达他人及用于文字转语音。 3. 超拟人音色：选择自然真实的音色，提升语音播报效果。 4. 文字放大及镜像反转：双击文本可放大可反转，方便他人浏览。 5. 快捷短语：常用短语设置为快捷方式，轻松表达。 6. 字体大小调节：可调节字体大小，提升可读性。 7. 方言识别：目前支持包括粤语、四川话、济南话、河南话、武汉话等部分地区语种识别。 *支持Android 10 - 15的安卓系统，兼容澎湃及鸿蒙系统（至于鸿蒙Next系统侧载兼容性未知则自行测试）使用说明：至于无限制的文字转语音软件，可转至请戳 > > 此工具。首次使用有详细的说明引导。可能需给予录音等权限（至于具体需要获取什么权限及相关隐私内容，软件的使用协议已经罗列得一清二楚，请自行阅读）。底部可转录可输入，长按已转录文字可标注、复制、多选等，双击可镜像倒立放大，输入文字后点击可发声朗读；右上角齿轮可设置音色、方言语种识别等；若想要随时自由切换普通话及方言语种的，请设置为方言识别即可。其余功能自行体验~~~ PS： 1. 本软件目前已有上架部分国内市场，自然是已经通过安全检测，此处仅作分流及旧版备份之用。另因完全依赖在线且采取即录即转功能，故安装包没有很大，介意的勿下勿用，嫌弃的推荐卸载并转用其它工具~~~ 2. 可能因低版本的安卓系统处理算力环境不够（跟低版本PC无法运行部分智能产品一个道理），故基本淘汰六七年前过老的系统机型。其次，此处的音色仅为蓝厂自带提供；而此处的方言识别是对所说的方言翻译并转为通俗易懂的简明版文字，类似观看的直白口语化字幕，并非微信那种的直译（粤）式文字转录且后期还要处理的形式。目前新版本不影响旧版本的使用。 3. 另提一下，实时转录采集声音时要想识别精确的话建议保持该软件独占扬声器、语速不宜过快且处于相对安静的无过多背景音环境，即不要外放音乐或其它app上的声音。并不是不行，只是识别效果不太好而已。偏门点的语音不排除偶尔抽风的情况，清除缓存重试即可，各位自行衡量~~~

CosyVoice2-0.5B | 3秒极速复刻情感语音 |

CosyVoice迎来全面升级，提供更准、更稳、更快、更好的语音生成能力。CosyVoice is undergoing a comprehensive upgrade, providing more accurate, stable, faster, and better voice generation capabilities.精心制作的整合包，无需繁琐配置，解压即可使用！ Cosy Voice 2.0 是由阿里通义千问团队开发的开源情感语音合成项目，具备突破性的“三秒极速复刻”功能，能够精准生成与真人几乎无差别的情感音频，支持粤语、日语、韩语和英语等多种语言。项目地址：https://github.com/FunAudioLLM/CosyVoice CosyVoiceV20 夸盘链接： https://pan.quark.cn/s/f554cc77216c 提取码：JhB5 CosyVoiceV20 度盘链接: https://pan.baidu.com/s/1ijX1LUgMYjCpYfPuzffxaQ?pwd=dmz5 提取码: dmz5 AI整合包大全夸盘链接： https://pan.quark.cn/s/7e9a72581a2e 提取码：15aw AI整合包大全度盘链接： https://pan.baidu.com/s/1LTRkbvIggJrcJTtg_gGJug?pwd=v47a 提取码：v47a

AI声音克隆 - AnyVoice

仅需3秒即可创建完美的AI声音克隆。采用先进AI技术的超真实声音克隆。

易剪媒 - 首创对话式Ai剪辑工具

行业首创的对话式AI视频剪辑工具，支持批量自动视频处理，指令收藏等强大功能，多平台使用，免费无广告。

AURIS | 自动为您的视频生成字幕

Auris AI 制作字幕准确而简单自动为您的视频生成字幕。每月 15 分钟使用 5 GB 存储空间/月 1 个文件导出/月每月上传 1 个文件带水印

DaVinci Resolve | Blackmagic Design

颠覆传统的全新创意工具，集剪辑、调色、专业音频后期制作于一身的一站式流程！

必剪-让创作更有趣

必剪-让创作更有趣

AI配音专家

本软件是完全免费的产品，使用本软件前需要自行申请各个平台的文字转语音API（阿里、微软），才能正常使用！ AI配音专家是一款非常专业且优秀的文字转语音软件，顾名思义通过这款软件可帮助用户快速将文字内容转换为语音文件，若我们需要对某个视频文件进行配音或者需要合成语音文件用于商场、超市商品叫卖，这时候就可以用到这款软件，该软件采用阿里语音合成引擎，合成速度不仅快而且还能够准确的将文字内容转换为对应的语音，内置多种不同类型的语音，在选择语音类型前可进行试听，满意后再进行使用，除此之外还可添加背景音乐，音量、语速、背景音量都可自由调节，

网易爆米花（原网易Filmly） - 智能媒体库&全能播放器

网易爆米花（原网易Filmly），一款具有刮削功能的视频播放器。支持直连阿里云盘、百度网盘等，支持WebDAV、SMB协议。可聚合电影、电视剧、综艺等影视资源，自动匹配海报、评分、简介等媒体信息，自动归类合集，搭建私人个性化专享影视库。支持手机、电视、平板、电脑等多终端跨平台观影，同步影视资源及播放记录。

tts-tauri: 使用Tauri开发的微软配音工具

使用Tauri开发的微软配音工具

虚拟音频线 VB-Audio Virtual Apps

装一个虚拟音频通道，就可以在任何可以使用麦克风的程序中用虚拟通道输入，当然balabolka的命令行版本必不可少，以下是网址：虚拟音频线下载：https://vb-audio.com/Cable/index.htm 虚拟一个通道是永久免费的，够用了

阿蛮歌霸官网-免费点歌系统|ktv点歌系统

阿蛮歌霸Ktv点歌系统官方网站，提供免费的KTV点歌软件，免费的KTV歌库（包括ktv必点歌曲）及其更新，以及ktv点歌系统所必需的相关设备和配件。

听免费的音乐 - 搜索免费的歌曲 - Freemake Music Box

Freemake Music Box: 搜索任何免费的在线音乐。听免费的在线音乐。创建免费的MP3播放列表。Free Music Player。

适用于任何网站的快速视频下载器 - DataTool.vip

DataTool.vip 是您的一站式视频下载平台，涵盖 TikTok、Instagram、Twitter、Facebook、Dailymotion、Vimeo 以及几乎所有网站。快速、无水印，支持高达 4K 分辨率。下载您想要的任何视频！

Text To Speech - 在线文字转语音

Text To Speech，文本转语音，文本朗读，让机器能够说话。构建自然说话的应用和服务，从 147 种语言和变体中选择 456 种语音。借助高表现力和类似人类的神经语音，让你的方案生动起来。

WSGsoft 软件工作室： PLuckyDraw(抽奖软件)、TimingLaba(定时播放音乐软件)、AdVoice(语音广告制作软件)、MiniVCap(摄像头监控软件)

作者很懒，没有填写描述。

智谱开源GLM-TTS语音模型：3 秒复刻人声，支持多情感表达！

在这里插入图片描述 GLM-TTS是基于大语言模型的高质量文本转语音（TTS）合成系统，支持零样本语音克隆和流式推理。该系统采用两阶段架构，结合了用于生成语音标记的大语言模型（LLM）和用于波形合成的流匹配模型。通过引入多奖励强化学习框架，GLM-TTS显著提升了生成语音的表现力，相比传统TTS系统实现了更自然的情感控制。核心特性零样本语音克隆：仅需3-10秒提示音频即可克隆任意说话者音色强化学习增强的情感控制：采用多奖励强化学习框架（GRPO）优化韵律和情感表达高质量合成：生成语音质量媲美商业系统，同时降低字符错误率（CER）音素级控制：支持"混合音素+文本"输入，实现精准发音控制（如多音字）流式推理：支持实时音频生成，适用于交互式应用场景双语支持：针对中英文混合文本进行优化

媒体人工具箱 MTools

一款功能强大、界面精美的现代化桌面工具集集成图片处理、音视频编辑、AI 智能工具、开发辅助等功能，支持跨平台GPU加速，三个版本都没有模型，低配电脑用体积最小的版本即可。模型按需求下载

OpenScreen：免费开源的 Screen Studio 平替，打造丝滑的产品演示视频原创

摘要：你是否羡慕 Twitter/X 上那些带有平滑缩放、运动模糊和精美背景的产品演示视频？通常这些视频是由 Screen Studio 制作的，但其订阅价格让不少人望而却步。今天为大家介绍一个基于 Electron 和 React 的开源项目——OpenScreen，它能让你零成本制作出同款丝滑的演示视频！ 1. 痛点：为什么我们需要 OpenScreen？在展示代码、演示 APP 或制作教程时，普通的录屏往往平平无奇。Screen Studio 凭借其自动变焦、光标平滑移动和美观的背景填充，成为了行业标杆。但是，对于偶尔使用的开发者来说，每月 29 美元（或更高）的订阅费是一笔不小的开支。 OpenScreen 的出现正是为了解决这个问题。正如作者在 README 中所说： "如果你不想支付订阅费，但想要一个能够满足基本需求、制作精美产品演示的工具，这就是为你准备的。" 它完全免费，支持个人和商业用途，并且代码完全开源。 🚀 项目地址：https://github.com/siddharthvaddem/openscreen 2. 核心功能亮点 ✨ OpenScreen 虽然定位为“更简单的版本”，但核心功能非常能打，完美覆盖了制作高颜值演示视频的需求： 🔍 丝滑变焦（Zoom）：支持手动添加缩放关键帧，你可以自定义缩放的深度、持续时间和位置。 🌫️ 运动模糊（Motion Blur）：这是让视频看起来“高级”的关键，在移动视角时自动添加模糊效果。 🖼️ 自定义背景：录制移动端或非全屏内容时，可以自动填充壁纸、纯色、渐变色或自定义图片作为背景。 ✂️ 视频裁剪与修剪：支持裁剪视频画面以隐藏不需要的部分，或剪辑掉多余的时间段。 📝 标注功能：可以在视频中添加文本、箭头或图片标注。 📱 多比例导出：支持导出不同的长宽比和分辨率，适应不同的社交媒体平台。 3. 技术栈大揭秘 🛠️ 作为一个 CSDN 的技术博主，我们不仅要会用，还要了解它是怎么实现的。OpenScreen 是一个非常现代化的前端桌面应用项目，技术栈如下： Electron：构建跨平台桌面应用的基础。 React & TypeScript：构建用户界面的核心逻辑，类型安全。 Vite：极速的构建工具。 PixiJS：这是重点！项目使用 PixiJS 处理高性能的 2D 渲染（视频画面的缩放、模糊等特效大概率由此实现）。 dnd-timeline：用于实现视频编辑轨道的时间轴拖拽功能。如果你想学习如何用 Web 技术开发高性能的视频编辑工具，这个项目的源码非常有参考价值。 4. 安装与使用教程 🚀 由于项目还处于 Beta 阶段，目前需要在 GitHub Releases 页面下载安装包。 📥 下载前往 Release 页面下载对应系统的安装包。 🍎 macOS 用户特别注意由于开源项目没有购买昂贵的 Apple 开发者证书，安装后可能会被 macOS 的 Gatekeeper 拦截。解决方法如下：安装应用。打开终端，运行以下命令（移除隔离属性）： Bash 进入系统偏好设置 > 安全性与隐私，授予 App “屏幕录制” 和 “辅助功能” 的权限。 🐧 Linux 用户下载 .AppImage 文件后，需要赋予执行权限： Bash 5. 实际操作体验打开 OpenScreen 后，你会看到一个简洁的界面：录制：选择录制整个屏幕或特定窗口。编辑：录制完成后进入编辑器。在时间轴上点击，添加 Zoom（缩放）节点。调整右侧面板的 Padding（边距）、Roundness（圆角）和 Shadow（阴影），让视频窗口看起来像悬浮在背景上一样立体。打开 Motion Blur 开关，瞬间丝滑。导出：渲染视频并保存。

GitHub - jamiepine/voicebox: The open-source AI voice studio. Clone, dictate, create. · GitHub

The open-source AI voice studio. Clone, dictate, create. - jamiepine/voicebox

VideoSrt · 视频语音自动生成字幕SRT文件的开源软件工具

VideoSrt 是用 Golang语言，基于 lxn/walk Windows-GUI 工具包开发。这是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。适用于快速、批量的为媒体（视频/音频）生成中/英文字幕、文本文件的业务场景。项目地址：https://github.com/wxbool/video-srt-windows Videosrt Pro 免费版已发布，建议使用！您可以加入QQ群下载软件（788514992） Videosrt Pro 相关说明：https://www.yuque.com/viggo-t7cdi/videosrt-pro/cpwtwl Videosrt 0.3.5 版本将会使用以下接口： ● 阿里云 OSS对象存储 ● 阿里云录音文件识别 ● 百度翻译开放平台翻译API ● 腾讯云翻译API 界面预览应用场景 ● 识别视频/音频的语音生成字幕文件（支持中英互译，双语字幕） ● 提取视频/音频的语音文本 ● 批量翻译、过滤处理/编码SRT字幕文件软件优势 ● 使用阿里云语音识别接口，准确度高，标准普通话/英语识别率95%以上 ● 视频识别无需上传原视频，方便快速且节省时间 ● 支持多任务多文件批量处理 ● 支持视频、音频常见多种格式文件 ● 支持同时输出字幕SRT文件、LRC文件、普通文本3种类型 ● 支持语气词过滤、自定义文本过滤、正则过滤等，使软件生成的字幕更加精准 ● 支持字幕中英互译、双语字幕输出，及日语、韩语、法语、德语、西班牙语、俄语、意大利语、泰语等 ● 支持多翻译引擎（百度翻译、腾讯云翻译） ● 支持批量翻译、编码SRT字幕文件配置方法开源参考视频：https://www.bilibili.com/video/av97739847/?vd_source=41b75b18f280e0ad59228053a304ca90

来剪-免费、AI 驱动的全平台视频编辑工具

🎁 完全免费，自由创作真正的完全免费，无隐藏收费，无水印限制。我们相信创作自由应属于每一个人。 🛡️ 🔒 隐私至上，数据归你所有操作均在本地或您的浏览器中完成。无需上传视频到云端，保护您的个人隐私和商业机密。 ✨ 🤖 100+ 全球大模型集成深度整合 Gemini, DeepSeek, Qwen, ComfyUI 等前沿 AI。从自动字幕到 AI 生图，全方位赋能剪辑流程。 💻 🎨 跨平台极致体验无论您使用的是 Windows、macOS 还是 Linux，都能享受到丝滑、响应迅速的专业编辑体验。 🌐 🌍 多语言支持强大的 ASR 语音识别与双语字幕翻译功能，支持 SRT/VTT/LRC 等多种格式导出。 🚀 🛠️ 插件驱动，无限扩展基于现代技术栈构建，支持插件化扩展。欢迎加入开源社区，共同打造视频编辑的未来。

Shotcut - Home

Shotcut is a free, open source, cross-platform video editor for Windows, Mac and Linux

站内搜索

影音视频

友情链接