Skip to content

本地部署 — 搭建你的 AI 绘画电脑

Stable Diffusion 跟 Midjourney 最大的区别是:免费、开源、完全可控——但需要你自己部署到电脑上。

Stable Diffusion(简称 SD)是一个开源的 AI 图像生成模型。你用电脑本地运行它,无需付费,没有次数限制。

SD 的优势:
✅ 完全免费(不用按张付费)
✅ 本地运行(隐私安全,不联网)
✅ 魔改空间大(LoRA、ControlNet 等扩展)
✅ 可以离线使用
✅ 你能完全控制每个参数
SD 的不足:
❌ 需要性能较好的显卡
❌ 安装配置比 Midjourney 复杂
❌ 需要手动下载和管理模型

Stable Diffusion 最依赖的是 显卡(GPU)。不同显卡决定你能跑多快。

显卡:NVIDIA 显存 6GB+(推荐 8GB+)
内存:16GB
硬盘:50GB 空闲空间(模型文件很占空间)
系统:Windows 10/11 或 Linux
RTX 4090 24GB → 约 10-15 秒/张(1秒生成4张)
RTX 4070 12GB → 约 25-35 秒/张
RTX 3060 12GB → 约 35-50 秒/张
RTX 2060 6GB → 约 60-80 秒/张
无独显(CPU) → 约 5-10 分钟/张(极其慢,不推荐)

注意

  • NVIDIA 显卡 + Windows/Linux:最佳选择,10-60 秒/张
  • AMD 显卡:也能用但需要额外配置,不推荐新手
  • Intel 显卡:相对麻烦,新手慎入
  • Mac(M系列):可以用但速度较慢,且功能受限

第二步:一键安装包(推荐新手)

Section titled “第二步:一键安装包(推荐新手)”

推荐使用 秋叶一键包(整合了各种配置和插件,省去手动配置的麻烦):

  1. 获取安装包

    • 访问 Bilibili 搜索「秋叶整合包」或从百度网盘获取
    • 下载后解压到硬盘(建议放在留有空余空间的盘,如 D:\SD)
  2. 安装 Python(如果包内不带):

    • 下载 Python 3.10.6(重要:SD 对 Python 版本要求严格)
    • 安装时务必勾选「Add Python to PATH」
  3. 启动

    • 解压后文件夹里找到 A启动器.exe
    • 双击运行,首次启动会自动检测环境和安装依赖
  1. 打开启动器
  2. 点击「一键启动」
  3. 等待终端跑完所有依赖(首次启动约 5-15 分钟)
  4. 浏览器自动打开 http://127.0.0.1:7860 — 你就能看到 Stable Diffusion 的界面了!

第三步:手动安装(进阶玩家)

Section titled “第三步:手动安装(进阶玩家)”

如果你想从零自己搭建,可以按以下步骤操作:

下载 Git for Windows,默认选项安装。

打开命令提示符或终端:

Terminal window
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
cd stable-diffusion-webui
Terminal window
# 确认 Python 版本
python --version
# 应该显示 3.10.x
# 创建虚拟环境(可选)
python -m venv venv
# Windows 激活
.\venv\Scripts\activate
Terminal window
# Windows
.\webui-user.bat
# Linux/Mac
./webui.sh

首次启动会自动下载依赖和环境。请保持网络通畅,整个过程可能需要 30 分钟到 1 小时。

SD 本身是「空的」— 需要下载模型才能生成图片。

模型名称特点下载地址
SDXL 1.0最新基础模型,画质优秀Hugging Face
Realistic Vision逼真风格,最受欢迎CivitAI
DreamShaper通用型好,平衡真实与艺术CivitAI
Anything V52次元动漫风格Hugging Face

下载后的模型文件(.safetensors 格式)放到:

stable-diffusion-webui\models\Stable-diffusion\

放好后点击 WebUI 界面左上角的「刷新」图标,模型就会出现在下拉菜单中。

1. Realistic Vision V6.0 → 真实照片风格,最实用
2. DreamShaper Imagination → 创意艺术风格
3. Anything V5 → 动漫插画风格
4. ChilloutMix → 亚洲人像,适合写真
┌──────────────────────────────────────────────────────┐
│ Stable Diffusion WebUI │
├─────────┬────────────────────────────────────────────┤
│ 功能页签 │ 参数区域 │
│ ┌─────┐ │ ┌─────────────────────────────────────┐ │
│ │txt2img│ │ Prompt: [___________________________] │ │
│ │img2img│ │ Negative prompt: [_________________] │ │
│ │Extras │ │ │ │
│ │... │ │ Sampling method: [Euler a ▼] │ │
│ │ │ │ Sampling steps: [20 ▼] │ │
│ │ │ │ Width: [512] Height: [512] │ │
│ │ │ │ Batch count: 1 Batch size: 1 │ │
│ │ │ │ CFG Scale: [7 ▼] │ │
│ │ │ │ Seed: [-1 ▼] │ │
│ │ │ │ │ │
│ │ │ │ [Generate] │ │
│ └─────┘ │ └─────────────────────────────────────┘ │
│ │ │
├──────────┴────────────────────────────────────────────┤
│ 输出结果区域 │
│ ┌────────────────────────────────────────────────┐ │
│ │ │ │
│ │ [生成的图片会显示在这里] │ │
│ │ │ │
│ └────────────────────────────────────────────────┘ │
└──────────────────────────────────────────────────────┘
区域说明
txt2img文生图(主要功能区)
img2img图生图(基于图片改动)
Extras图片后期处理(高清放大等)
PNG Info查看图片的生成参数
  1. 确保在 txt2img 页面
  2. 选择一个模型(如 Realistic Vision)
  3. 在 Prompt 框输入正向提示词:
a beautiful girl with long black hair wearing a white dress, standing in a sunflower field at sunset, golden hour lighting, soft warm tones, photorealistic, highly detailed, 8K, masterpiece
  1. 在 Negative Prompt 框输入负向提示词:
ugly, deformed, blurry, low quality, extra limbs, bad anatomy, disfigured, watermark, signature, text
  1. 点击 Generate 按钮
Step 0/20 — 开始生成
Step 10/20 — 大概能看到轮廓了
Step 20/20 — 即将完成
[done] → 图片出现在右侧输出区域
10 步 → 出图快但粗糙
20 步 → 通用值,质量与速度平衡
30 步 → 更精细,适合复杂场景
50 步 → 过度了,步数多了不会更好

推荐值:20-30 步

方法特点推荐
Euler a最快,均衡⭐ 新手首选
DPM++ 2M Karras质量好⭐ 质量优先
DDIM经典方法一般
LMS较低质量不推荐

推荐:先用 Euler a,熟了换 DPM++ 2M Karras

3-5 → 低强度,AI 自由发挥
7-9 → 默认范围,遵循提示词
12-15 → 高强度,严格遵循
20+ → 过头了,颜色会过度饱和

推荐值:7-9

512x512 → 标准尺寸,生成速度最快
768x512 → 横版,适合风景
512x768 → 竖版,适合人像
768x768 → 大尺寸,需要更多显存
1024x1024 → 适合 SDXL 模型

注意

SD 的标准尺寸是 512x512。超出太多容易出双头、多腿的异常图。 如果是 SDXL 模型,推荐 1024x1024。

负向提示词告诉 AI 你不想要什么,对提升质量非常关键。

ugly, deformed, blurry, low quality, worst quality, bad anatomy,
disfigured, poorly drawn, extra limbs, weird hands,
watermark, text, signature, username, logo,
oversaturated, low contrast, bad lighting,
naked, nsfw, frame, border, cut off
# 人像
ugly, deformed, bad eyes, bad face, extra fingers, bad hands,
bad proportions, bad anatomy, disfigured, cropped
# 风景/建筑
blurry, low quality, unnatural colors, oversaturated, foggy, dirty
# 动漫
ugly, bad anatomy, bad proportions, duplicate, messy, unfinished

种子值是生成图片的「身份证号」。

Seed: -1 随机种子(每次都不一样)
Seed: 1234 固定种子(相同提示词得到相同结果)

实用技巧

  • 生成一张满意的图 → 记住它的种子值
  • 微调提示词时固定种子 → 只改变你想调整的部分
  • 找到好种子 → 点击绿色的「♻️」按钮复制种子

可能是显卡驱动问题。更新 NVIDIA 驱动后重启。

降低图片尺寸(如从 512x768 降到 512x512),或减少 Batch size。

检查是否把正向提示词误写到了负向提示框内。增加采样步数到 25-30。

Q: 图总出现奇怪的手、多余的腿?

Section titled “Q: 图总出现奇怪的手、多余的腿?”

这是 SD 的常见问题。在负向提示词中加入 bad hands, extra fingers, ugly hands。或者用 ControlNet OpenPose 来控制姿态。

恭喜!你已经成功搭建了 SD 环境并生成了第一张图!接下来学习 文生图基础 — 深入文生图技巧、写好提示词、提升出图质量。


💡 今日练习:用不同的提示词生成 20 张不同风格的图。尝试改变采样方法、CFG Scale、步数,观察每个参数对结果的影响。