本地部署 — 搭建你的 AI 绘画电脑
Stable Diffusion 跟 Midjourney 最大的区别是:免费、开源、完全可控——但需要你自己部署到电脑上。
什么是 Stable Diffusion?
Section titled “什么是 Stable Diffusion?”Stable Diffusion(简称 SD)是一个开源的 AI 图像生成模型。你用电脑本地运行它,无需付费,没有次数限制。
SD 的优势:✅ 完全免费(不用按张付费)✅ 本地运行(隐私安全,不联网)✅ 魔改空间大(LoRA、ControlNet 等扩展)✅ 可以离线使用✅ 你能完全控制每个参数
SD 的不足:❌ 需要性能较好的显卡❌ 安装配置比 Midjourney 复杂❌ 需要手动下载和管理模型第一步:检查你的硬件
Section titled “第一步:检查你的硬件”Stable Diffusion 最依赖的是 显卡(GPU)。不同显卡决定你能跑多快。
显卡:NVIDIA 显存 6GB+(推荐 8GB+)内存:16GB硬盘:50GB 空闲空间(模型文件很占空间)系统:Windows 10/11 或 Linux不同显卡的跑图速度参考
Section titled “不同显卡的跑图速度参考”RTX 4090 24GB → 约 10-15 秒/张(1秒生成4张)RTX 4070 12GB → 约 25-35 秒/张RTX 3060 12GB → 约 35-50 秒/张RTX 2060 6GB → 约 60-80 秒/张无独显(CPU) → 约 5-10 分钟/张(极其慢,不推荐)注意
- NVIDIA 显卡 + Windows/Linux:最佳选择,10-60 秒/张
- AMD 显卡:也能用但需要额外配置,不推荐新手
- Intel 显卡:相对麻烦,新手慎入
- Mac(M系列):可以用但速度较慢,且功能受限
第二步:一键安装包(推荐新手)
Section titled “第二步:一键安装包(推荐新手)”推荐使用 秋叶一键包(整合了各种配置和插件,省去手动配置的麻烦):
-
获取安装包:
- 访问 Bilibili 搜索「秋叶整合包」或从百度网盘获取
- 下载后解压到硬盘(建议放在留有空余空间的盘,如 D:\SD)
-
安装 Python(如果包内不带):
- 下载 Python 3.10.6(重要:SD 对 Python 版本要求严格)
- 安装时务必勾选「Add Python to PATH」
-
启动:
- 解压后文件夹里找到
A启动器.exe - 双击运行,首次启动会自动检测环境和安装依赖
- 解压后文件夹里找到
启动 WebUI
Section titled “启动 WebUI”- 打开启动器
- 点击「一键启动」
- 等待终端跑完所有依赖(首次启动约 5-15 分钟)
- 浏览器自动打开
http://127.0.0.1:7860— 你就能看到 Stable Diffusion 的界面了!
第三步:手动安装(进阶玩家)
Section titled “第三步:手动安装(进阶玩家)”如果你想从零自己搭建,可以按以下步骤操作:
1. 安装 Git
Section titled “1. 安装 Git”下载 Git for Windows,默认选项安装。
2. 克隆仓库
Section titled “2. 克隆仓库”打开命令提示符或终端:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.gitcd stable-diffusion-webui3. 设置 Python 环境
Section titled “3. 设置 Python 环境”# 确认 Python 版本python --version# 应该显示 3.10.x
# 创建虚拟环境(可选)python -m venv venv# Windows 激活.\venv\Scripts\activate# Windows.\webui-user.bat
# Linux/Mac./webui.sh首次启动会自动下载依赖和环境。请保持网络通畅,整个过程可能需要 30 分钟到 1 小时。
第四步:下载模型
Section titled “第四步:下载模型”SD 本身是「空的」— 需要下载模型才能生成图片。
下载主流模型
Section titled “下载主流模型”| 模型名称 | 特点 | 下载地址 |
|---|---|---|
| SDXL 1.0 | 最新基础模型,画质优秀 | Hugging Face |
| Realistic Vision | 逼真风格,最受欢迎 | CivitAI |
| DreamShaper | 通用型好,平衡真实与艺术 | CivitAI |
| Anything V5 | 2次元动漫风格 | Hugging Face |
下载后的模型文件(.safetensors 格式)放到:
stable-diffusion-webui\models\Stable-diffusion\放好后点击 WebUI 界面左上角的「刷新」图标,模型就会出现在下拉菜单中。
推荐新手必装的模型
Section titled “推荐新手必装的模型”1. Realistic Vision V6.0 → 真实照片风格,最实用2. DreamShaper Imagination → 创意艺术风格3. Anything V5 → 动漫插画风格4. ChilloutMix → 亚洲人像,适合写真第五步:认识 WebUI 界面
Section titled “第五步:认识 WebUI 界面”┌──────────────────────────────────────────────────────┐│ Stable Diffusion WebUI │├─────────┬────────────────────────────────────────────┤│ 功能页签 │ 参数区域 ││ ┌─────┐ │ ┌─────────────────────────────────────┐ ││ │txt2img│ │ Prompt: [___________________________] │ ││ │img2img│ │ Negative prompt: [_________________] │ ││ │Extras │ │ │ ││ │... │ │ Sampling method: [Euler a ▼] │ ││ │ │ │ Sampling steps: [20 ▼] │ ││ │ │ │ Width: [512] Height: [512] │ ││ │ │ │ Batch count: 1 Batch size: 1 │ ││ │ │ │ CFG Scale: [7 ▼] │ ││ │ │ │ Seed: [-1 ▼] │ ││ │ │ │ │ ││ │ │ │ [Generate] │ ││ └─────┘ │ └─────────────────────────────────────┘ ││ │ │├──────────┴────────────────────────────────────────────┤│ 输出结果区域 ││ ┌────────────────────────────────────────────────┐ ││ │ │ ││ │ [生成的图片会显示在这里] │ ││ │ │ ││ └────────────────────────────────────────────────┘ │└──────────────────────────────────────────────────────┘| 区域 | 说明 |
|---|---|
| txt2img | 文生图(主要功能区) |
| img2img | 图生图(基于图片改动) |
| Extras | 图片后期处理(高清放大等) |
| PNG Info | 查看图片的生成参数 |
第六步:生成你的第一张图
Section titled “第六步:生成你的第一张图”- 确保在
txt2img页面 - 选择一个模型(如 Realistic Vision)
- 在 Prompt 框输入正向提示词:
a beautiful girl with long black hair wearing a white dress, standing in a sunflower field at sunset, golden hour lighting, soft warm tones, photorealistic, highly detailed, 8K, masterpiece- 在 Negative Prompt 框输入负向提示词:
ugly, deformed, blurry, low quality, extra limbs, bad anatomy, disfigured, watermark, signature, text- 点击 Generate 按钮
Step 0/20 — 开始生成Step 10/20 — 大概能看到轮廓了Step 20/20 — 即将完成
[done] → 图片出现在右侧输出区域第七步:理解关键参数
Section titled “第七步:理解关键参数”采样步数(Sampling steps)
Section titled “采样步数(Sampling steps)”10 步 → 出图快但粗糙20 步 → 通用值,质量与速度平衡30 步 → 更精细,适合复杂场景50 步 → 过度了,步数多了不会更好推荐值:20-30 步
采样方法(Sampling method)
Section titled “采样方法(Sampling method)”| 方法 | 特点 | 推荐 |
|---|---|---|
| Euler a | 最快,均衡 | ⭐ 新手首选 |
| DPM++ 2M Karras | 质量好 | ⭐ 质量优先 |
| DDIM | 经典方法 | 一般 |
| LMS | 较低质量 | 不推荐 |
推荐:先用 Euler a,熟了换 DPM++ 2M Karras
CFG Scale(提示词强度)
Section titled “CFG Scale(提示词强度)”3-5 → 低强度,AI 自由发挥7-9 → 默认范围,遵循提示词12-15 → 高强度,严格遵循20+ → 过头了,颜色会过度饱和推荐值:7-9
512x512 → 标准尺寸,生成速度最快768x512 → 横版,适合风景512x768 → 竖版,适合人像768x768 → 大尺寸,需要更多显存1024x1024 → 适合 SDXL 模型注意
SD 的标准尺寸是 512x512。超出太多容易出双头、多腿的异常图。 如果是 SDXL 模型,推荐 1024x1024。
第八步:负向提示词
Section titled “第八步:负向提示词”负向提示词告诉 AI 你不想要什么,对提升质量非常关键。
通用负向提示词
Section titled “通用负向提示词”ugly, deformed, blurry, low quality, worst quality, bad anatomy,disfigured, poorly drawn, extra limbs, weird hands,watermark, text, signature, username, logo,oversaturated, low contrast, bad lighting,naked, nsfw, frame, border, cut off针对不同场景的负向提示词
Section titled “针对不同场景的负向提示词”# 人像ugly, deformed, bad eyes, bad face, extra fingers, bad hands,bad proportions, bad anatomy, disfigured, cropped
# 风景/建筑blurry, low quality, unnatural colors, oversaturated, foggy, dirty
# 动漫ugly, bad anatomy, bad proportions, duplicate, messy, unfinished第九步:种子(Seed)
Section titled “第九步:种子(Seed)”种子值是生成图片的「身份证号」。
Seed: -1 随机种子(每次都不一样)Seed: 1234 固定种子(相同提示词得到相同结果)实用技巧:
- 生成一张满意的图 → 记住它的种子值
- 微调提示词时固定种子 → 只改变你想调整的部分
- 找到好种子 → 点击绿色的「♻️」按钮复制种子
Q: 生成的图全是黑的?
Section titled “Q: 生成的图全是黑的?”可能是显卡驱动问题。更新 NVIDIA 驱动后重启。
Q: 报错内存不足?
Section titled “Q: 报错内存不足?”降低图片尺寸(如从 512x768 降到 512x512),或减少 Batch size。
Q: 图很模糊?
Section titled “Q: 图很模糊?”检查是否把正向提示词误写到了负向提示框内。增加采样步数到 25-30。
Q: 图总出现奇怪的手、多余的腿?
Section titled “Q: 图总出现奇怪的手、多余的腿?”这是 SD 的常见问题。在负向提示词中加入 bad hands, extra fingers, ugly hands。或者用 ControlNet OpenPose 来控制姿态。
恭喜!你已经成功搭建了 SD 环境并生成了第一张图!接下来学习 文生图基础 — 深入文生图技巧、写好提示词、提升出图质量。
💡 今日练习:用不同的提示词生成 20 张不同风格的图。尝试改变采样方法、CFG Scale、步数,观察每个参数对结果的影响。