不用独立显卡,能在本地运行多种开源大模型的Ai工具GPT4All

什么是GPT4All? GPT4All是一个能开源的、无需 GPU 或互联网、就能免费使用、具有隐私保障的聊天机器人。它可以可在消费级 CPU 和任何 GPU 上本地运行的大型语言模型,比如说最新的Mistral 7b 基础模型。请注意,您的 CPU 需要支持AVX 或 AVX2 指令。 【项目github地址】【官方网站】 安装: 1、去官网下载对应系统GPT4All安装程序,我们以Windows系统为例【官网下载Windows客户端】 2、【官方网站】下载想用的大模型数据,建议mistral-7b的大模型。如果下载不了,我们也已经把Windows安装程序和mistral-7b-openorca.Q4_0和gpt4all-falcon-q4_0.gguf 两个大模型一上传到网盘。【百度网盘下载】 3、下载完成后运行安装程序进行安装即可,很简单就细说了。 使用: 1、安装完成后,运行GPT4All,点击右上角设置(齿轮)- Application设置下模型下载存放的目录即可。 2、关闭GPT4All后重新进入,就可以看到已经下载好的模型,选择想要使用的模型,在下面的聊天框里就可以和AI愉快的玩耍了。 经过简单使用,总结下优缺点: 缺点: 1、以最新Mistral 7b 基础模型模型为例,经过简单的使用,其英文方面能力远大于中文能力。 2、相对于OpenAI GPT4等商业大模型还有较大差距,并不能完全替代ChatGPT,但已经是能用状态。 3、就算不用独立显卡,对CPU还是有一定要求的,就算是支持AVX 或 AVX2 指令的cpu,如果性能比较低,那速度也会变的非常感人。 优点: 1、在可用状态下完全免费 2、支持多种开源大模型 3、可以本地运行,在隐私方面将得到更好的保障 4、使用门槛较低,大部分主流配置的电脑和系统都可以运行。 5、各种开源大模型虽说目前还远远不能和GPT4等顶尖的AI对比,但它对打破少数机构对新科技的垄断,提高竞争,对普通大众和技术发展来说都是很有帮助的。

开源克隆声音工具,将文字或其他语音转成该音色

一、软件说明 这个声音克隆工具,可使用任何人类音色,将一段文字合成为使用该音色说话的声音,或者将一个声音使用该音色转换为另一个声音。 使用非常简单,没有N卡GPU也可以使用,下载预编译版本,双击 app.exe 打开一个web界面,鼠标点点就能用。 支持 中文、英文、日语、韩语 4种语言,可在线从麦克风录制声音。 为保证合成效果,建议录制时长5秒到20秒,发音清晰准确,不要存在背景噪声。 英文效果比中文效果好。 二、使用方法 1、下载预编译版,适用于window 10/11(已含文字到语音模型,语音到语音模型需单独下载),Mac下请拉取源码自行编译。 【github下载】【百度网盘下载:提取码: hadx】 2、解压后进入解压目录,双击 start.bat ,等待自动打开web窗口。 3、输入文字或者上传想转换的音频文件,然后录制或从本地上传一段音色文件,开始转换 4、预编译版仅支持CPU,只包含文字到语音模型,如果需要语音到语音功能,即上传一个音频文件,然后将该音频转换为使用选定音色的另一个音频,需单独下载语音到语音(speech-to-speech)模型,然后放到和app.exe同级的tts文件夹中。 speech-to-speech模型下载:【百度网盘:提取码: g3w8】【github下载】 三、常见问题 1、启动后需要冷加载模型,会消耗一些时间,请耐心等待显示出http://127.0.0.1:9988, 并自动打开浏览器页面后,稍等两三分钟后再进行转换 2、如果打开的cmd窗口很久不动,需要在上面按下回车才继续输出,请在cmd左上角图标上单击,选择“属性”,然后取消“快速编辑”和“插入模式”的复选框 四、源码部署,以window为例

基于AI,能无损分辨率去除图片/视频硬字幕、水印,无需申请第三方API,本地运行的软件。

一、它能做什么? video-subtitle-remover (VSR) 是一款基于AI技术,它能够通过AI算法模型,对去除字幕文本的区域进行填充(非相邻像素填充与马赛克去除),无损分辨率去除视频中的硬字幕,并支持自定义字幕位置(传入位置)和自动去除所有字幕的软件(不传入位置)。 项目开源地址:https://github.com/YaoFANGUK/video-subtitle-remover 二、硬件要求: GPU:GTX 1060或以上显卡(目前暂不支持Nvidia以外的显卡) CPU: 支持AVX指令集 三、使用说明:直接下载压缩包解压运行,仅支持Nvidia显卡。 Windows GPU版本v1.0.0(GPU): 百度网盘: vsr_windows_gpu_v1.0.0.7z 提取码:vsr1 Google Drive: vsr_windows_gpu_v1.0.0.7z

使用So-VITS-SVC训练属于自己的声音教程

前言:训练出来的声音模型可以在视频、语音或歌曲翻唱使用。 条件: 1、一段自己干净的人声,在安静的环境下录制,最好别低于30分钟,声音文件格式WAV,如果有多个文件,请批量按顺序重命名下文件。 2、一块8G以上显存的独立显卡的电脑。当然也可以用CPU,但那训练速度就慢很多了。 3、电脑上下载好Audio Slicer(音频分割切片)和so-vits-svc 链接:https://pan.baidu.com/s/1glwuY4Zv2mpp05T2uNxzeA提取码:wk5g 操作: 1、新建文件夹,命名为OUT。 2、运行Audio Slicer,拖入需要切片的音频文件,输出文件就选择刚新建的OUT文件夹。然后点start开始。 3、检查切片后的音频文件大小,每段长度最好别超过7秒,如果有发现还有比较长时间的文件,请按下图修改参数后再次切片处理,直到每段长度不超过7秒。 4、解压so-vits-svc,然后把存放切片的OUT文件夹放入so-vits-svc\dataset_raw文件夹下 5、返回so-vits-svc目录,点击”webui.bat“启动。可能需要花几分钟到十几分钟时间。如果没问题等待安装环境后会自动跳出界面,如果没有自动跳出,请按照提示复制IP:端口好,到浏览器里手动打开。 6、点界面上方”训练-识别数据集“会自动识别我们刚放到dataset_raw\OUT文件夹,其他参数不用修改,然后点击下面的数据预处理按钮,开始预处理数据。这个过程需要时间比较长,主要取决于电脑的显卡性能。下面可以看到处理进度,请耐心等待处理完成。 7、预处理完成后清空数据信息,如果没有独立显卡就需要选择CPU来训练,但时间要非常久,要做好思想准备。建议使用NVIDIA的显卡,选择CUDA,这样可以极大提高训练速度。其他只要注意保存步数那,按推荐的设置就可以。然后点击从头开始训练就可以了。 8、训练的时间是非常长的,看显卡性能,需要2-4天左右才能得到比较好的效果,当然,训练可以暂停的,如果被中断,只需再次打开so-vits-svc,点击”继续上次的训练“就可以接着下去训练。 9、查看训练步骤和效果。运行so-vits-svc目录下的tensoboard.bat文件,然后把显示的地址:端口复制到浏览器里打开。然后点上面的AUDIO的页面就可以看到已训练的步骤和试听效果。 10、如果你觉得效果已经可以了,就可以暂停训练了。然后打开推理页面,选择训练好的模型,编码器默认,配置文件选择默认的config.json就可以,然后点下面的加载模型,成功后就可以,上传音频文件,替换原文件的语音或文字转语音。 总之,怎么使用训练好的模型,各位小伙伴就可以发挥各自的聪明才智了。

能在一个窗口里同时操作几个 AI机器人,实现一条指令、多条回复。

如果你需要经常测试AI性能,又或你需要 推荐用ChatHub客户端,它可以同屏显示多个AI窗口,一次输入,返回多个结果。直接在Chrome和Edge安装好ChatHub插件就能使用。 github地址:https://github.com/chathub-dev/chathub Chrome扩展插件地址:https://chrome.google.com/webstore/detail/chathub-all-in-one-chatbo/iaakpnchhognanibcahlpcplchdfmgma/related?utm_source=chathub.gg

Exit mobile version