老显卡的福音：2025 年最强本地端文字生成影片模型Wan2.1安装与使用指南

Spread the love

Wan2.1 是 2025 年一款令人惊艳的本地端文字生成影片模型，支持中英文混合提示词，兼容消费级 GPU，即使是老旧的 NVIDIA RTX 2060 也能生成高质量影片。本教程将带你一步步完成 Wan2.1 的安装与使用，生成属于你的创意影片！无论你是新手还是有经验的用户，这篇简单易懂的指南都能帮到你。

Table of Contents

Wan2.1 模型简介 (#wan21-模型简介)
安装准备 (#安装准备)
模型与工作流下载 (#模型与工作流下载)
文字生成影片操作流程 (#文字生成影片操作流程)
优化影片生成速度与品质 (#优化影片生成速度与品质)
常见问题与解决方法 (#常见问题与解决方法)
总结与推荐 (#总结与推荐)

Wan2.1 模型简介：官方地址

Wan2.1 是全球首款支持中英文混合提示词的文字生成影片模型，基于 ComfyUI 平台运行，包含以下四种模型：

文字转影片 (T2V) 1.3B：支持 480P 分辨率，适合低配 GPU。
文字转影片 14B：支持 480P 和 720P 分辨率。
影像转影片 14B：支持 480P 和 720P 分辨率。

亮点

低硬件要求：T2V-1.3B 模型仅需 8.19GB 显存，RTX 4090 可在约 4 分钟生成 5 秒 480P 影片。
中英文混合：支持中英文提示词，创作更灵活。
强大视频编码：支持任意长度 1080P 视频的编码与解码，保留时间信息。

本教程以 T2V-1.3B 文字转影片模型为例，带你完成从安装到生成影片的全流程。

安装准备

1. 确保硬件支持

最低显存要求：8GB（建议 12GB 或更高）。
推荐 GPU：NVIDIA RTX 2060 或更高（如 RTX 4090）。
如果显存较低（如 8GB），需在启动 ComfyUI 时添加 –lowvram 参数以优化内存使用。

2. 安装 ComfyUI：官网下载

Wan2.1 基于 ComfyUI 运行，请确保安装最新版本的 ComfyUI：安装可看我之前文章《ComfyUI教程一：从零开始掌握AI影像生成工具》

打开 ComfyUI Manager。
点击 Update ComfyUI。
更新完成后，点击 Restart 重启 ComfyUI。

Wan1-1 老显卡的福音：2025 年最强本地端文字生成影片模型Wan2.1安装与使用指南

模型与工作流下载

1. 下载模型

Wan2.1 提供多个模型版本，推荐从官方页面下载 T2V-1.3B 模型：

访问 Wan2.1 官网（官方地址）。
下载以下文件：
- Diffusion Model（T2V-1.3B 文字转影片模型）。
- 其他必要文件（如 VAE 等）。
注意路径：
- 将下载的模型文件放入 ComfyUI 指定路径（通常在 ComfyUI/models 文件夹）。
- 不要直接使用网页上的默认路径，可能导致模型加载失败。按下图的路径存放

Wan2-1 老显卡的福音：2025 年最强本地端文字生成影片模型Wan2.1安装与使用指南

2. 下载工作流

从官网下载文字转影片工作流（非影像转影片工作流）。
保存工作流文件：
- 右键点击工作流链接，选择另存链接（不要另存为图片）。
- 将文件保存到本地，稍后导入 ComfyUI。

Wan3-1 老显卡的福音：2025 年最强本地端文字生成影片模型Wan2.1安装与使用指南

文字生成影片操作流程

1. 导入工作流

打开 ComfyUI，拖放下载的工作流文件到界面，或通过 Load 按钮导入。
如果提示缺少节点：
- 检查是否更新了 ComfyUI 至最新版本。
- 重启 ComfyUI 并刷新浏览器，节点通常会自动加载（Wan2.1 所需节点为 ComfyUI 内置）。

2. 配置工作流

Wan2.1 的工作流与文生图类似，核心节点包括：

KSampler：控制生成质量和速度。
正向/反向提示词：输入中英文混合描述（如“雨中玻璃窗，水滴滑落，蒸汽升腾”）。
模型加载：选择 T2V-1.3B 模型路径。
输出节点：将文生图改为生成影片。

3. 生成影片

输入正向提示词，描述你想要的场景（支持中英文）。
保持默认设置（或根据需要调整，见下一节）。
点击 Queue Prompt 开始生成。
检查显存占用（RTX 2060 约需 8GB，生成 5 秒 480P 影片约需 365 秒）。

示例效果：生成的影片能清晰呈现玻璃上的水滴、蒸汽等细节，品质令人惊艳。

优化影片生成速度与品质

Wan2.1 允许在速度与品质间权衡，以下是两种关键调整方法：

1. 调整 KSampler 参数

采样步数（Steps）：
- 默认：30 步，生成时间约 365 秒，品质最佳。
- 优化：降低至 12 步，搭配 Euler 采样方法和 Normal Scheduler，生成时间缩短至 166 秒，品质略降但仍可接受。
- 建议范围：12-30 步，超过 30 步细节提升有限。
效果：12 步时，玻璃水滴细节减少，蒸汽可能不明显；20 步时（272 秒），细节更丰富，适合追求平衡的用户。

Wan4-1 老显卡的福音：2025 年最强本地端文字生成影片模型Wan2.1安装与使用指南

Wan5-1 老显卡的福音：2025 年最强本地端文字生成影片模型Wan2.1安装与使用指南

2. 调整影片分辨率与长度

默认设置：480P，5 秒。
优化：降低宽高（如 320×240），生成时间可缩短至 50 秒，品质仍不错。
注意：分辨率过低可能影响细节，需根据需求调整。

Wan6-1 老显卡的福音：2025 年最强本地端文字生成影片模型Wan2.1安装与使用指南

常见问题与解决方法

缺少节点：
- 确保 ComfyUI 为最新版本。
- 重启 ComfyUI 并刷新浏览器，通常可解决。
模型加载失败：
- 检查模型文件是否放在正确路径（ComfyUI/models）。
- 确保下载完整，未中断。
显存不足：
- 添加启动参数 –lowvram。
- 降低分辨率或采样步数。
生成时间过长：
- 降低采样步数（12-20）。
- 减小影片宽高。

总结与推荐

Wan2.1 是目前本地端最强大的文字生成影片模型之一，相比混元、Stable Video Diffusion、LTX-Video 等模型，其在中英文支持和低硬件要求上的表现尤为突出。即使使用老旧的 RTX 2060（12GB 显存），也能在 50-365 秒内生成高质量 480P 影片，令人惊叹。

推荐人群

想在本地生成创意影片的 AI 爱好者。
拥有中低端 GPU（如 RTX 2060）的用户。
需要中英文混合提示词的创作者。

下一步

尝试不同提示词，探索创意可能性。
下载其他 Wan2.1 模型（如 14B 版本）以体验更高分辨率。
订阅相关教程频道，获取更多 ComfyUI 和 Wan2.1 的技巧。

如果这篇教程对你有帮助，欢迎分享、点赞或留言！祝你用 Wan2.1 创作出属于自己的视觉奇迹！