VGoods

开源克隆声音工具，将文字或其他语音转成该音色

On 2023年11月24日 By VGoods In AI, 应用

一、软件说明这个声音克隆工具，可使用任何人类音色，将一段文字合成为使用该音色说话的声音，或者将一个声音使用该音色转换为另一个声音。使用非常简单，没有N卡GPU也可以使用，下载预编译版本，双击 app.exe 打开一个web界面，鼠标点点就能用。支持中文、英文、日语、韩语 4种语言，可在线从麦克风录制声音。为保证合成效果，建议录制时长5秒到20秒，发音清晰准确，不要存在背景噪声。英文效果比中文效果好。二、使用方法 1、下载预编译版，适用于window 10/11(已含文字到语音模型，语音到语音模型需单独下载),Mac下请拉取源码自行编译。【github下载】【百度网盘下载：提取码: hadx】 2、解压后进入解压目录，双击 start.bat ，等待自动打开web窗口。 3、输入文字或者上传想转换的音频文件，然后录制或从本地上传一段音色文件，开始转换 4、预编译版仅支持CPU，只包含文字到语音模型，如果需要语音到语音功能，即上传一个音频文件，然后将该音频转换为使用选定音色的另一个音频，需单独下载语音到语音(speech-to-speech)模型，然后放到和app.exe同级的tts文件夹中。 speech-to-speech模型下载：【百度网盘：提取码: g3w8】【github下载】三、常见问题 1、启动后需要冷加载模型，会消耗一些时间，请耐心等待显示出http://127.0.0.1:9988，并自动打开浏览器页面后，稍等两三分钟后再进行转换 2、如果打开的cmd窗口很久不动，需要在上面按下回车才继续输出，请在cmd左上角图标上单击，选择“属性”，然后取消“快速编辑”和“插入模式”的复选框四、源码部署，以window为例

基于AI，能无损分辨率去除图片/视频硬字幕、水印，无需申请第三方API，本地运行的软件。

On 2023年11月23日 By VGoods In AI, 应用

一、它能做什么？ video-subtitle-remover (VSR) 是一款基于AI技术，它能够通过AI算法模型，对去除字幕文本的区域进行填充（非相邻像素填充与马赛克去除），无损分辨率去除视频中的硬字幕，并支持自定义字幕位置（传入位置）和自动去除所有字幕的软件（不传入位置）。项目开源地址：https://github.com/YaoFANGUK/video-subtitle-remover 二、硬件要求： GPU：GTX 1060或以上显卡（目前暂不支持Nvidia以外的显卡） CPU: 支持AVX指令集三、使用说明：直接下载压缩包解压运行，仅支持Nvidia显卡。 Windows GPU版本v1.0.0（GPU）：百度网盘: vsr_windows_gpu_v1.0.0.7z 提取码：vsr1 Google Drive: vsr_windows_gpu_v1.0.0.7z