做自媒体或者电商设计,最头疼的就是找图。Midjourney 要钱,Stable Diffusion 对中文支持烂。
最近阿里通义实验室开源的 Z-Image 火了。它最大的必杀技是:不仅懂中文,而且对电脑配置极度宽容。 哪怕你只有一台 6GB 显存的笔记本(比如 RTX 3060 Laptop),也能跑出商业级的海报。
本文谢绝废话,直接手把手教你在本地用 ComfyUI 部署 Z-Image,不仅有保姆级步骤,还有防报错避坑指南。
🛑 第一步:对号入座,你的电脑该下哪个版?
Z-Image 很贴心地提供了两个版本。下载前,请先看一眼你的显卡配置。选错版本,要么爆显存(OOM),要么速度慢到哭。
| 显卡等级 | 典型型号 | 推荐方案 | 显存占用 | 生成速度 |
|---|---|---|---|---|
| 土豪组 | RTX 4070/4080/4090 3060 (12G版) | BF16 原版 (画质最顶,速度最快) | ~12 GB | 2-4秒 |
| 平民组 | RTX 3060 (6G版) RTX 4050/3050 | GGUF 量化版 (画质肉眼难分,显存砍半) | < 6 GB | 1-2分钟 |
💡 博主建议:如果你不确定显存够不够,无脑选 GGUF 量化版。它的画质损失微乎其微,但稳定性极高,几乎不会报错。
🛠️ 第二步:ComfyUI 安装与核心文件归位
ComfyUI 是目前最流行的 AI 绘图界面。如果你还没装,去 GitHub 搜“ComfyUI Portable”下载解压即可。
接下来是关键!90% 的人失败都是因为文件放错了位置。 请严格对照下表:
1. 下载核心模型 (根据你的显存二选一)
去 Hugging Face 或 ModelScope 下载以下文件,并放入 ComfyUI/models/diffusion_models/ 目录:
- 土豪组 (≥12G) 下载:
z_image_turbo_bf16.safetensors.【huggingface下载地址】 - 平民组 (6-8G) 下载:
z_image_turbo_Q4_K_M.gguf.【huggingface下载地址】
2. 下载文本编码器 (Text Encoder)
放入 ComfyUI/models/text_encoders/ 目录:
(注意:这是 Z-Image 懂中文的关键,它其实是一个 Qwen 大语言模型)
- 土豪组 (≥12G) 下载:
qwen_3_4b.safetensors. - 平民组 (6-8G) 下载:
qwen_3_4b_Q4_K_M.gguf- ⚠️ 高能预警:低显存用户必须下载这个
gguf后缀的!如果你用了原版,光这个文件就会吃掉 6G 显存,直接卡死。
- ⚠️ 高能预警:低显存用户必须下载这个
3. 下载 VAE (通用)
放入 ComfyUI/models/vae/ 目录:
- 下载文件:
ae.safetensors(建议使用官方推荐版)
⚙️ 第三步:ComfyUI 工作流设置 (抄作业时间)
场景 A:显存 ≥ 12GB (BF16 原版工作流)
- 打开 ComfyUI,加载 “Z-Image Turbo文生图” 默认工作流。
- Load Diffusion Model:选
z_image_turbo_bf16。 - DualCLIPLoader:加载
qwen_3_4b。 - 直接点生成,起飞!
场景 B:显存 6-8GB (GGUF 量化工作流) 🌟重点
低显存用户需要多做一步插件安装:
- 打开 ComfyUI Manager,搜索并安装 ComfyUI-GGUF 插件,重启 ComfyUI。
- 替换节点:
- 用
Unet Loader (GGUF)节点加载z_image_turbo_Q4_K_M.gguf。 - 用
CLIP Loader (GGUF)节点加载qwen_3_4b_Q4_K_M.gguf。
- 用
- 连接 VAE 节点,搞定。
⚡ 核心参数设置 (别乱改!)
Z-Image 对参数非常敏感,设错了会出现“死黑图”或“蜡像皮”。请锁死以下参数:
- Steps (步数):8 或 9 (千万别设 20+,步数多反而画质差!)
- CFG:1.0 (雷打不动)
- Sampler:
euler - Scheduler:
sgm_uniform(这个模式噪点最少) - 分辨率:推荐
1024x1024或1280x720。- 想做 4K 海报?先生成 1024 的图,再用 Upscale 放大,别直接跑 4K。
🎨 第四步:实战!能直接商用的提示词模板
Z-Image 喜欢“啰嗦”的提示词。你可以用 ChatGPT 帮你把简单的想法扩写成包含光影、材质、相机参数的长指令。
这里提供两个即抄即用的模板:
1. 电商产品摄影(质感炸裂)
Prompt:
一张超写实、电影感的商业产品摄影大片。主体是一个半透明的琥珀色玻璃香水瓶,配有拉丝金金属瓶盖,优雅地坐落在从平静水面浮出的一块粗糙纹理的深色板岩上。场景设定在日出时分雾气缭绕的热带雨林中。光照与氛围:强烈的体积光(丁达尔效应)透过上方郁郁葱葱的棕榈叶倾泻而下,投下复杂的斑驳阴影…技术规格: 哈苏 X2D 100C,8k分辨率,虚幻引擎5风格。
2. 东方美学海报(汉服人像)
Prompt:
一位绝世容颜的唐代贵妃,身着层层叠叠的红色真丝汉服,绣着金线凤凰。背景是繁华的长安城夜景,孔明灯漂浮。妆造细节:精致花钿,金钗摇曳。氛围: 暖黄灯笼与冷蓝月光交织,电影级照明,8K分辨率,妖猫传视觉风格。
🔧 常见问题急救包
- 生成的图全是黑的?
- 检查 VAE 没加载,或者 Steps 设太高了(超过 10 容易黑)。
- 报错 OOM (Out of Memory)?
- 你肯定混用了文件!低显存用户检查一下,是不是 Text Encoder 误用了
safetensors原版?请换回GGUF版。
- 你肯定混用了文件!低显存用户检查一下,是不是 Text Encoder 误用了
- 文字乱码?
- Z-Image 支持中文,但尽量用简体中文,不要中英混杂过于严重。
总结:
Z-Image 是目前市面上对低配电脑最友好的中文生图模型。哪怕你只有一台几年前的老笔记本,只要按照本文的“GGUF 方案”操作,一样能做出惊艳的商业海报。
动手试试吧,有报错欢迎在评论区留言!
GitHub:https://github.com/Tongyi-MAI/Z-Image
Hugging Face:https://huggingface.co/Tongyi-MAI/Z-Image-Turbo
ModelScope:https://modelscope.cn/models/Tongyi-MAI/Z-Image-Turbo

