Wan2.1 是 2025 年一款令人惊艳的本地端文字生成影片模型,支持中英文混合提示词,兼容消费级 GPU,即使是老旧的 NVIDIA RTX 2060 也能生成高质量影片。本教程将带你一步步完成 Wan2.1 的安装与使用,生成属于你的创意影片!无论你是新手还是有经验的用户,这篇简单易懂的指南都能帮到你。
目录
- Wan2.1 模型简介 (#wan21-模型简介)
- 安装准备 (#安装准备)
- 模型与工作流下载 (#模型与工作流下载)
- 文字生成影片操作流程 (#文字生成影片操作流程)
- 优化影片生成速度与品质 (#优化影片生成速度与品质)
- 常见问题与解决方法 (#常见问题与解决方法)
- 总结与推荐 (#总结与推荐)
Wan2.1 模型简介:官方地址
Wan2.1 是全球首款支持中英文混合提示词的文字生成影片模型,基于 ComfyUI 平台运行,包含以下四种模型:
- 文字转影片 (T2V) 1.3B:支持 480P 分辨率,适合低配 GPU。
- 文字转影片 14B:支持 480P 和 720P 分辨率。
- 影像转影片 14B:支持 480P 和 720P 分辨率。
亮点
- 低硬件要求:T2V-1.3B 模型仅需 8.19GB 显存,RTX 4090 可在约 4 分钟生成 5 秒 480P 影片。
- 中英文混合:支持中英文提示词,创作更灵活。
- 强大视频编码:支持任意长度 1080P 视频的编码与解码,保留时间信息。
本教程以 T2V-1.3B 文字转影片模型 为例,带你完成从安装到生成影片的全流程。
安装准备
1. 确保硬件支持
- 最低显存要求:8GB(建议 12GB 或更高)。
- 推荐 GPU:NVIDIA RTX 2060 或更高(如 RTX 4090)。
- 如果显存较低(如 8GB),需在启动 ComfyUI 时添加 –lowvram 参数以优化内存使用。
2. 安装 ComfyUI:官网下载
Wan2.1 基于 ComfyUI 运行,请确保安装最新版本的 ComfyUI:安装可看我之前文章《ComfyUI教程一:从零开始掌握AI影像生成工具》
- 打开 ComfyUI Manager。
- 点击 Update ComfyUI。
- 更新完成后,点击 Restart 重启 ComfyUI。
模型与工作流下载
1. 下载模型
Wan2.1 提供多个模型版本,推荐从官方页面下载 T2V-1.3B 模型:
- 访问 Wan2.1 官网(官方地址)。
- 下载以下文件:
- Diffusion Model(T2V-1.3B 文字转影片模型)。
- 其他必要文件(如 VAE 等)。
- 注意路径:
- 将下载的模型文件放入 ComfyUI 指定路径(通常在 ComfyUI/models 文件夹)。
- 不要直接使用网页上的默认路径,可能导致模型加载失败。按下图的路径存放
2. 下载工作流
- 从官网下载 文字转影片工作流(非影像转影片工作流)。
- 保存工作流文件:
- 右键点击工作流链接,选择 另存链接(不要另存为图片)。
- 将文件保存到本地,稍后导入 ComfyUI。
文字生成影片操作流程
1. 导入工作流
- 打开 ComfyUI,拖放下载的工作流文件到界面,或通过 Load 按钮导入。
- 如果提示缺少节点:
- 检查是否更新了 ComfyUI 至最新版本。
- 重启 ComfyUI 并刷新浏览器,节点通常会自动加载(Wan2.1 所需节点为 ComfyUI 内置)。
2. 配置工作流
Wan2.1 的工作流与文生图类似,核心节点包括:
- KSampler:控制生成质量和速度。
- 正向/反向提示词:输入中英文混合描述(如“雨中玻璃窗,水滴滑落,蒸汽升腾”)。
- 模型加载:选择 T2V-1.3B 模型路径。
- 输出节点:将文生图改为生成影片。
3. 生成影片
- 输入正向提示词,描述你想要的场景(支持中英文)。
- 保持默认设置(或根据需要调整,见下一节)。
- 点击 Queue Prompt 开始生成。
- 检查显存占用(RTX 2060 约需 8GB,生成 5 秒 480P 影片约需 365 秒)。
示例效果:生成的影片能清晰呈现玻璃上的水滴、蒸汽等细节,品质令人惊艳。
优化影片生成速度与品质
Wan2.1 允许在速度与品质间权衡,以下是两种关键调整方法:
1. 调整 KSampler 参数
- 采样步数(Steps):
- 默认:30 步,生成时间约 365 秒,品质最佳。
- 优化:降低至 12 步,搭配 Euler 采样方法 和 Normal Scheduler,生成时间缩短至 166 秒,品质略降但仍可接受。
- 建议范围:12-30 步,超过 30 步细节提升有限。
- 效果:12 步时,玻璃水滴细节减少,蒸汽可能不明显;20 步时(272 秒),细节更丰富,适合追求平衡的用户。
2. 调整影片分辨率与长度
- 默认设置:480P,5 秒。
- 优化:降低宽高(如 320×240),生成时间可缩短至 50 秒,品质仍不错。
- 注意:分辨率过低可能影响细节,需根据需求调整。
常见问题与解决方法
- 缺少节点:
- 确保 ComfyUI 为最新版本。
- 重启 ComfyUI 并刷新浏览器,通常可解决。
- 模型加载失败:
- 检查模型文件是否放在正确路径(ComfyUI/models)。
- 确保下载完整,未中断。
- 显存不足:
- 添加启动参数 –lowvram。
- 降低分辨率或采样步数。
- 生成时间过长:
- 降低采样步数(12-20)。
- 减小影片宽高。
总结与推荐
Wan2.1 是目前本地端最强大的文字生成影片模型之一,相比混元、Stable Video Diffusion、LTX-Video 等模型,其在中英文支持和低硬件要求上的表现尤为突出。即使使用老旧的 RTX 2060(12GB 显存),也能在 50-365 秒内生成高质量 480P 影片,令人惊叹。
推荐人群
- 想在本地生成创意影片的 AI 爱好者。
- 拥有中低端 GPU(如 RTX 2060)的用户。
- 需要中英文混合提示词的创作者。
下一步
- 尝试不同提示词,探索创意可能性。
- 下载其他 Wan2.1 模型(如 14B 版本)以体验更高分辨率。
- 订阅相关教程频道,获取更多 ComfyUI 和 Wan2.1 的技巧。
如果这篇教程对你有帮助,欢迎分享、点赞或留言!祝你用 Wan2.1 创作出属于自己的视觉奇迹!