进阶技巧 — LoRA 训练、AI 视频、高阶工作流

这一课是 SD 的终极指南。学会这些高阶技巧后，你就能真正把 SD 变成生产力工具。

一、LoRA 模型

LoRA 是 SD 中最重要的扩展形式——你可以理解成给 AI 装上一个「特化插件」。

什么是 LoRA？

LoRA（Low-Rank Adaptation）= 轻量级的模型微调插件

想象一下：
- SD 基础模型 = 一个全能画师
- LoRA = 给他一本「指定画风/角色的参考手册」

LoRA 文件很小（一般 30-200MB），不改变原模型，
只指导 AI 在生成时加入特定的风格或角色特征。

LoRA 的用途

🎨 风格 LoRA
   - 某个画师的特定风格
   - 某个材质效果（水彩、水墨、赛博朋克）
   - 某个时代的画风（复古、浮世绘）

👤 角色 LoRA
   - 让 AI 认识某个人物的长相
   - 生成同一个人在不同场景的图
   - 你自己的头像 LoRA

🏃 姿势 LoRA
   - 特定的动作或姿势
   - 适合关键帧生成

📦 物品种类 LoRA
   - 某款相机/镜头效果模拟
   - 某种特效（烟雾、光影）

在哪里下载 LoRA

网站	说明	地址
CivitAI	全球最大的 SD 模型社区	civitai.com
Hugging Face	专业人士作品多	huggingface.co

LoRA 怎么用

下载 .safetensors 文件
放到以下目录：

stable-diffusion-webui\models\Lora\

在 WebUI 中，在提示词框下方找到 LoRA 标签，点击加载

或者手动在提示词中添加：
<lora:model_name:0.8>

0.8 是权重（推荐 0.6-1.0）
权重越高，LoRA 特征越明显

LoRA 权重控制

<lora:chilloutmix-style:1.0> ← 完全推���该风格
<lora:chilloutmix-style:0.8> ← 强烈推荐
<lora:chilloutmix-style:0.5> ← 一半一半
<lora:chilloutmix-style:0.3> ← 轻微参考

二、LoRA 组合使用

你可以同时使用多个 LoRA，混合它们的特征：

# 风格 LoRA + 角色 LoRA
<lora:watercolor_style:0.8>, <lora:my_character:0.7>
1girl, portrait, beautiful

# 效果：用水彩画画你的角色

组合技巧

组合	效果	推荐权重
角色 + 场景	特定角色在不同场景	角色 0.8 + 场景 0.6
风格 + 材质	某种风格下的特殊材质	风格 0.6 + 材质 0.7
姿势 + 服装	特定动作和服装	姿势 1.0 + 服装 0.6

三、自己训练 LoRA

准备训练你自己的 LoRA 模型，让 AI 认识一个特定角色或风格。

训练前的准备工作

# 素材要求
- 最少 15-20 张高质量图片（推荐 30+）
- 所有图片风格一致
- 人物照：不同角度、不同表情、不同光线
- 风格照：同一画风的多个例子

# 文件命名
图片统一命名为：数字_名字.jpg
如：1_mydog.jpg, 2_mydog.jpg, 3_mydog.jpg

# 标注文字
每张图配一个 txt 文件，写上描述
如 1_mydog.txt → "a golden retriever sitting on grass, sunny day"

使用 Kohya GUI 训练

推荐使用 Kohya_ss GUI，是目前最成熟的 LoRA 训练工具。

# 安装 Kohya
1. 下载 Kohya_ss GUI
2. 运行 setup 脚本
3. 打开浏览器界面

# 训练流程
1. 准备素材文件夹（放训练图和标注）
2. 选择基础模型（推荐 SDXL 或 SD 1.5）
3. 设置训练参数
4. 点击 Start Training
5. 等待训练完成（约 30-60 分钟）

训练参数参考

# 推荐参数
训练步数: 1000-2000
学习率: 1e-4
网络维度: 32
网络 alpha: 16
分辨率: 512
batch size: 2-4
优化器: AdamW8bit

四、AI 视频

用 SD 生成动画

方法1：AnimateDiff（免费）

AnimateDiff 扩展可以让 SD 生成短视频：

安装方式：
1. 在 Extensions 中搜索「sd-webui-animatediff」
2. 安装并重启
3. 下载 AnimateDiff 模型文件

使用方法：
1. 在 txt2img 页面开启 AnimateDiff
2. 设置帧数（16 帧 = 约 1 秒）
3. 写提示词
4. 生成后自动拼接成 GIF 或 MP4

提示词示例：

# 循环动画
prompt: blooming flower, time-lapse, petals opening, 4K, high quality
负向：ugly, blurry, low quality

方法2：Deforum（免费）

Deforum 能生成更复杂的运镜动画：

适合场景：
- 镜头推进/拉远效果
- 场景过渡动画
- 旋转视角效果
- 超现实主义的连续运动

安装：Extensions → Available → 搜索「deforum」→ Install

AI 运镜效果

# 推进效果
Animation Mode: 3D
Translation Z: 2 (每帧向Z轴移动)
Rotation 3D Z: 0.5 (每帧旋转)

# 平移效果
Animation Mode: 2D
Translation X: 3 (每帧向右移动)

五、图像超分辨率

用 ControlNet Tile 放大

把一张小图变得非常清晰，同时增加细节：

1. 切换到 img2img
2. 上传小图
3. 启用 ControlNet Tile
4. Upscaler: 4x-UltraSharp
5. Denoising: 0.3-0.4
6. 放大 2-4x

SD Upscale 脚本

WebUI 内置了 SD Upscale 脚本：

1. 在 img2img 页面
2. 把图片放大到 2x
3. 找到 Script → SD Upscale
4. Tile overlap: 64
5. Scale factor: 2
6. 生成

放大对比

方法	效果	速度	推荐场景
Extras 直接放大	一般	快	简单放大
Hires.fix（文生图）	好	中	同时生成+放大
img2img + ControlNet Tile	最好	慢	追求极致细节
SD Upscale 脚本	好	中	批量放大

六、InPainting（局部重绘）

用法

在 SD 中更强大、更灵活的局部修改：

1. 在 img2img 页面
2. 上传图片
3. 用画笔涂抹要修改的区域（变成白色）
4. 建议在设置中下载专用的 Inpainting 模型
5. 写提示词描述新内容
6. 设置参数，生成

InPainting 参数

Mask blur: 4-8       ← 边缘柔化程度
Masked Content: fill  ← 填充方式
Denoising: 0.75-1.0   ← 修改强度

应用场景

# 移除物体
涂抹一个不需要的元素 → 提示词只写背景描述

# 修改局部
涂抹衣服区域 → 提示词改成另一件衣服的颜色/款式

# 扩展画面
涂抹图片边缘 → 提示词描述新增的内容

七、提示词调试：高阶技巧

动态提示词（Dynamic Prompts）

每次生成自动随机选择不同的关键词：

安装 Dynamic Prompts 扩展

写法示例：
{red|blue|green|yellow} dress → 每次轮换不同颜色
{summer|winter|spring|autumn} landscape → 不同季节
{1girl|1boy|1cat} → 不同主体

高级用法：
[portrait|landscape|close-up] of a person → 交替不同焦段
<cat:0.5>, <dog:0.5> → 同时有两个元素

高级权重控制

# 混合权重
(cat:1.2) (dog:1.0)  → 猫比狗更突出
(cat:0.7) (dog:1.0)  → 两个元素接近

# 交替注意力
[cat|dog] in a park → 混合猫和狗的特征

# AND 语法
cat AND dog in a park → 同时有猫和狗

八、优化与加速

性能优化

# 如果不是 30 系以上的显卡，开启：
Settings → Optimizations →
  ✅ upcast cross attention layer to float32（减少显存）

# 进一步优化：
Settings → Optimizations →
  ✅ Batch cond/uncond（整合计算）

# 如果显存特别小（6GB以下）：
Settings → Stable Diffusion →
  ✅ Move VAE and CLIP to RAM when not using（共享显存）

生成速度对比

没优化时：1 张图 60 秒
优化后：1 张图 25-35 秒

加速技巧：
1. 使用 xFormers（可加速 30-50%）
2. 关闭不用��插件
3. 降低图像尺寸
4. 减少采样步数（Euler a 15 步够用）

九、常见问题（高级篇）

Q: 显存不足怎么办？

1. 降低图片尺寸（512x512）
2. Batch size 设为 1
3. 关闭不必要的插件
4. 使用 --medvram 或 --lowvram 参数启动
5. 更换为 SD 1.5 而非 SDXL（后者更耗显存）

Q: LoRA 效果不明显？

1. 提高 LoRA 权重（1.0-1.2）
2. 检查基础模型是否匹配 LoRA（SD 1.5 vs SDXL）
3. 训练用的素材量是否足够
4. LoRA 本身训练质量

Q: 生成的视频不连贯？

1. 增加帧数
2. 降低 Denoising Strength 到 0.5 以下
3. 使用 ControlNet Tile + Canny 双重控制
4. 固定种子值

十、综合工作流

完整项目工作流：从构思到成品

第1步：灵感收集
用 Midjourney/网络搜索找到灵感参考图

第2步：模型选择
选择合适的基础模型（写实/动漫/SDXL）

第3步：ControlNet
上传参考图，用 Canny/OpenPose/Depth 锁定结构

第4步：LoRA 加持
加载相关的风格或角色 LoRA

第5步：批量尝试
Batch count 4-8，用不同种子探索

第6步：精修
选中最好的 → 固定种子 → 微调提示词

第7步：高清
Hires.fix → ControlNet Tile → Extras 放大

第8步：后期
Photoshop 微调 → 输出成品

总结

恭喜你完成了 Stable Diffusion 全套教程！🎉

你现在已经掌握了：

✅ 本地部署 SD WebUI
✅ 写好正向/负向提示词
✅ 权重控制与提示词技巧
✅ 图生图与高清修复
✅ ControlNet 六种控制方式
✅ LoRA 使用与训练
✅ AI 视频生成入门
✅ 超分辨率与 InPainting

你已经从 SD 小白升级成了会用 SD 做生产的进阶玩家！

💡 今日练习：从 CivitAI 下载一个风格 LoRA 和一个角色 LoRA，尝试组合使用生成一组风格统一但内容不同的系列图。