开源克隆声音工具,将文字或其他语音转成该音色

一、软件说明 这个声音克隆工具,可使用任何人类音色,将一段文字合成为使用该音色说话的声音,或者将一个声音使用该音色转换为另一个声音。 使用非常简单,没有N卡GPU也可以使用,下载预编译版本,双击 app.exe 打开一个web界面,鼠标点点就能用。 支持 中文、英文、日语、韩语 4种语言,可在线从麦克风录制声音。 为保证合成效果,建议录制时长5秒到20秒,发音清晰准确,不要存在背景噪声。 英文效果比中文效果好。 二、使用方法 1、下载预编译版,适用于window 10/11(已含文字到语音模型,语音到语音模型需单独下载),Mac下请拉取源码自行编译。 【github下载】【百度网盘下载:提取码: hadx】 2、解压后进入解压目录,双击 start.bat ,等待自动打开web窗口。 3、输入文字或者上传想转换的音频文件,然后录制或从本地上传一段音色文件,开始转换 4、预编译版仅支持CPU,只包含文字到语音模型,如果需要语音到语音功能,即上传一个音频文件,然后将该音频转换为使用选定音色的另一个音频,需单独下载语音到语音(speech-to-speech)模型,然后放到和app.exe同级的tts文件夹中。 speech-to-speech模型下载:【百度网盘:提取码: g3w8】【github下载】 三、常见问题 1、启动后需要冷加载模型,会消耗一些时间,请耐心等待显示出http://127.0.0.1:9988, 并自动打开浏览器页面后,稍等两三分钟后再进行转换 2、如果打开的cmd窗口很久不动,需要在上面按下回车才继续输出,请在cmd左上角图标上单击,选择“属性”,然后取消“快速编辑”和“插入模式”的复选框 四、源码部署,以window为例

Continue reading

基于AI,能无损分辨率去除图片/视频硬字幕、水印,无需申请第三方API,本地运行的软件。

一、它能做什么? video-subtitle-remover (VSR) 是一款基于AI技术,它能够通过AI算法模型,对去除字幕文本的区域进行填充(非相邻像素填充与马赛克去除),无损分辨率去除视频中的硬字幕,并支持自定义字幕位置(传入位置)和自动去除所有字幕的软件(不传入位置)。 项目开源地址:https://github.com/YaoFANGUK/video-subtitle-remover 二、硬件要求: GPU:GTX 1060或以上显卡(目前暂不支持Nvidia以外的显卡) CPU: 支持AVX指令集 三、使用说明:直接下载压缩包解压运行,仅支持Nvidia显卡。 Windows GPU版本v1.0.0(GPU): 百度网盘: vsr_windows_gpu_v1.0.0.7z 提取码:vsr1 Google Drive: vsr_windows_gpu_v1.0.0.7z

Continue reading