本地部署 — 搭建你的 AI 绘画电脑

Stable Diffusion 跟 Midjourney 最大的区别是：免费、开源、完全可控——但需要你自己部署到电脑上。

什么是 Stable Diffusion？

Stable Diffusion（简称 SD）是一个开源的 AI 图像生成模型。你用电脑本地运行它，无需付费，没有次数限制。

SD 的优势：
✅ 完全免费（不用按张付费）
✅ 本地运行（隐私安全，不联网）
✅ 魔改空间大（LoRA、ControlNet 等扩展）
✅ 可以离线使用
✅ 你能完全控制每个参数

SD 的不足：
❌ 需要性能较好的显卡
❌ 安装配置比 Midjourney 复杂
❌ 需要手动下载和管理模型

第一步：检查你的硬件

Stable Diffusion 最依赖的是 显卡（GPU）。不同显卡决定你能跑多快。

最低配置

显卡：NVIDIA 显存 6GB+（推荐 8GB+）
内存：16GB
硬盘：50GB 空闲空间（模型文件很占空间）
系统：Windows 10/11 或 Linux

不同显卡的跑图速度参考

RTX 4090 24GB  →  约 10-15 秒/张（1秒生成4张）
RTX 4070 12GB  →  约 25-35 秒/张
RTX 3060 12GB  →  约 35-50 秒/张
RTX 2060 6GB   →  约 60-80 秒/张
无独显（CPU）  →  约 5-10 分钟/张（极其慢，不推荐）

注意

NVIDIA 显卡 + Windows/Linux：最佳选择，10-60 秒/张
AMD 显卡：也能用但需要额外配置，不推荐新手
Intel 显卡：相对麻烦，新手慎入
Mac（M系列）：可以用但速度较慢，且功能受限

第二步：一键安装包（推荐新手）

推荐使用 秋叶一键包（整合了各种配置和插件，省去手动配置的麻烦）：

下载与安装

获取安装包：
- 访问 Bilibili 搜索「秋叶整合包」或从百度网盘获取
- 下载后解压到硬盘（建议放在留有空余空间的盘，如 D:\SD）
安装 Python（如果包内不带）：
- 下载 Python 3.10.6（重要：SD 对 Python 版本要求严格）
- 安装时务必勾选「Add Python to PATH」
启动：
- 解压后文件夹里找到 A启动器.exe
- 双击运行，首次启动会自动检测环境和安装依赖

启动 WebUI

打开启动器
点击「一键启动」
等待终端跑完所有依赖（首次启动约 5-15 分钟）
浏览器自动打开 http://127.0.0.1:7860 — 你就能看到 Stable Diffusion 的界面了！

第三步：手动安装（进阶玩家）

如果你想从零自己搭建，可以按以下步骤操作：

1. 安装 Git

下载 Git for Windows，默认选项安装。

2. 克隆仓库

打开命令提示符或终端：

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui

3. 设置 Python 环境

# 确认 Python 版本
python --version
# 应该显示 3.10.x

# 创建虚拟环境（可选）
python -m venv venv
# Windows 激活
.\venv\Scripts\activate

4. 启动

# Windows
.\webui-user.bat

# Linux/Mac
./webui.sh

首次启动会自动下载依赖和环境。请保持网络通畅，整个过程可能需要 30 分钟到 1 小时。

第四步：下载模型

SD 本身是「空的」— 需要下载模型才能生成图片。

下载主流模型

模型名称	特点	下载地址
SDXL 1.0	最新基础模型，画质优秀	Hugging Face
Realistic Vision	逼真风格，最受欢迎	CivitAI
DreamShaper	通用型好，平衡真实与艺术	CivitAI
Anything V5	2次元动漫风格	Hugging Face

放在哪里？

下载后的模型文件（.safetensors 格式）放到：

stable-diffusion-webui\models\Stable-diffusion\

放好后点击 WebUI 界面左上角的「刷新」图标，模型就会出现在下拉菜单中。

第五步：认识 WebUI 界面

┌──────────────────────────────────────────────────────┐
│  Stable Diffusion WebUI                              │
├─────────┬────────────────────────────────────────────┤
│ 功能页签  │  参数区域                               │
│ ┌─────┐  │  ┌─────────────────────────────────────┐  │
│ │txt2img│  │  Prompt: [___________________________] │  │
│ │img2img│  │  Negative prompt: [_________________] │  │
│ │Extras │  │                                         │  │
│ │...    │  │  Sampling method: [Euler a  ▼]          │  │
│ │       │  │  Sampling steps:  [20  ▼]              │  │
│ │       │  │  Width:  [512]  Height: [512]          │  │
│ │       │  │  Batch count: 1   Batch size: 1        │  │
│ │       │  │  CFG Scale:  [7  ▼]                     │  │
│ │       │  │  Seed:  [-1  ▼]                         │  │
│ │       │  │                                         │  │
│ │       │  │         [Generate]                       │  │
│ └─────┘  │  └─────────────────────────────────────┘  │
│          │                                            │
├──────────┴────────────────────────────────────────────┤
│  输出结果区域                                          │
│  ┌────────────────────────────────────────────────┐   │
│  │                                                │   │
│  │  [生成的图片会显示在这里]                         │   │
│  │                                                │   │
│  └────────────────────────────────────────────────┘   │
└──────────────────────────────────────────────────────┘

核心功能区

区域	说明
txt2img	文生图（主要功能区）
img2img	图生图（基于图片改动）
Extras	图片后期处理（高清放大等）
PNG Info	查看图片的生成参数

第六步：生成你的第一张图

基础文生图

确保在 txt2img 页面
选择一个模型（如 Realistic Vision）
在 Prompt 框输入正向提示词：

a beautiful girl with long black hair wearing a white dress, standing in a sunflower field at sunset, golden hour lighting, soft warm tones, photorealistic, highly detailed, 8K, masterpiece

在 Negative Prompt 框输入负向提示词：

ugly, deformed, blurry, low quality, extra limbs, bad anatomy, disfigured, watermark, signature, text

点击 Generate 按钮

等待生成

Step 0/20  — 开始生成
Step 10/20 — 大概能看到轮廓了
Step 20/20 — 即将完成

[done] → 图片出现在右侧输出区域

第七步：理解关键参数

采样步数（Sampling steps）

10 步 → 出图快但粗糙
20 步 → 通用值，质量与速度平衡
30 步 → 更精细，适合复杂场景
50 步 → 过度了，步数多了不会更好

推荐值：20-30 步

采样方法（Sampling method）

方法	特点	推荐
Euler a	最快，均衡	⭐ 新手首选
DPM++ 2M Karras	质量好	⭐ 质量优先
DDIM	经典方法	一般
LMS	较低质量	不推荐

推荐：先用 Euler a，熟了换 DPM++ 2M Karras

CFG Scale（提示词强度）

3-5   → 低强度，AI 自由发挥
7-9   → 默认范围，遵循提示词
12-15 → 高强度，严格遵循
20+   → 过头了，颜色会过度饱和

推荐值：7-9

图像尺寸

512x512    → 标准尺寸，生成速度最快
768x512    → 横版，适合风景
512x768    → 竖版，适合人像
768x768    → 大尺寸，需要更多显存
1024x1024  → 适合 SDXL 模型

注意

SD 的标准尺寸是 512x512。超出太多容易出双头、多腿的异常图。如果是 SDXL 模型，推荐 1024x1024。

第八步：负向提示词

负向提示词告诉 AI 你不想要什么，对提升质量非常关键。

通用负向提示词

ugly, deformed, blurry, low quality, worst quality, bad anatomy,
disfigured, poorly drawn, extra limbs, weird hands,
watermark, text, signature, username, logo,
oversaturated, low contrast, bad lighting,
naked, nsfw, frame, border, cut off

针对不同场景的负向提示词

# 人像
ugly, deformed, bad eyes, bad face, extra fingers, bad hands,
bad proportions, bad anatomy, disfigured, cropped

# 风景/建筑
blurry, low quality, unnatural colors, oversaturated, foggy, dirty

# 动漫
ugly, bad anatomy, bad proportions, duplicate, messy, unfinished

第九步：种子（Seed）

种子值是生成图片的「身份证号」。

Seed: -1    随机种子（每次都不一样）
Seed: 1234  固定种子（相同提示词得到相同结果）

实用技巧：

生成一张满意的图 → 记住它的种子值
微调提示词时固定种子 → 只改变你想调整的部分
找到好种子 → 点击绿色的「♻️」按钮复制种子

常见问题

Q: 生成的图全是黑的？

可能是显卡驱动问题。更新 NVIDIA 驱动后重启。

Q: 报错内存不足？

降低图片尺寸（如从 512x768 降到 512x512），或减少 Batch size。

Q: 图很模糊？

检查是否把正向提示词误写到了负向提示框内。增加采样步数到 25-30。

Q: 图总出现奇怪的手、多余的腿？

这是 SD 的常见问题。在负向提示词中加入 bad hands, extra fingers, ugly hands。或者用 ControlNet OpenPose 来控制姿态。

下一步

恭喜！你已经成功搭建了 SD 环境并生成了第一张图！接下来学习 文生图基础 — 深入文生图技巧、写好提示词、提升出图质量。

💡 今日练习：用不同的提示词生成 20 张不同风格的图。尝试改变采样方法、CFG Scale、步数，观察每个参数对结果的影响。