Skip to content

进阶技巧 — LoRA 训练、AI 视频、高阶工作流

这一课是 SD 的终极指南。学会这些高阶技巧后,你就能真正把 SD 变成生产力工具。

LoRA 是 SD 中最重要的扩展形式——你可以理解成给 AI 装上一个「特化插件」。

LoRA(Low-Rank Adaptation)= 轻量级的模型微调插件
想象一下:
- SD 基础模型 = 一个全能画师
- LoRA = 给他一本「指定画风/角色的参考手册」
LoRA 文件很小(一般 30-200MB),不改变原模型,
只指导 AI 在生成时加入特定的风格或角色特征。
🎨 风格 LoRA
- 某个画师的特定风格
- 某个材质效果(水彩、水墨、赛博朋克)
- 某个时代的画风(复古、浮世绘)
👤 角色 LoRA
- 让 AI 认识某个人物的长相
- 生成同一个人在不同场景的图
- 你自己的头像 LoRA
🏃 姿势 LoRA
- 特定的动作或姿势
- 适合关键帧生成
📦 物品种类 LoRA
- 某款相机/镜头效果模拟
- 某种特效(烟雾、光影)
网站说明地址
CivitAI全球最大的 SD 模型社区civitai.com
Hugging Face专业人士作品多huggingface.co
  1. 下载 .safetensors 文件
  2. 放到以下目录:
stable-diffusion-webui\models\Lora\
  1. 在 WebUI 中,在提示词框下方找到 LoRA 标签,点击加载
或者手动在提示词中添加:
<lora:model_name:0.8>
0.8 是权重(推荐 0.6-1.0)
权重越高,LoRA 特征越明显
<lora:chilloutmix-style:1.0> ← 完全推���该风格
<lora:chilloutmix-style:0.8> ← 强烈推荐
<lora:chilloutmix-style:0.5> ← 一半一半
<lora:chilloutmix-style:0.3> ← 轻微参考

你可以同时使用多个 LoRA,混合它们的特征:

# 风格 LoRA + 角色 LoRA
<lora:watercolor_style:0.8>, <lora:my_character:0.7>
1girl, portrait, beautiful
# 效果:用水彩画画你的角色
组合效果推荐权重
角色 + 场景特定角色在不同场景角色 0.8 + 场景 0.6
风格 + 材质某种风格下的特殊材质风格 0.6 + 材质 0.7
姿势 + 服装特定动作和服装姿势 1.0 + 服装 0.6

准备训练你自己的 LoRA 模型,让 AI 认识一个特定角色或风格。

# 素材要求
- 最少 15-20 张高质量图片(推荐 30+)
- 所有图片风格一致
- 人物照:不同角度、不同表情、不同光线
- 风格照:同一画风的多个例子
# 文件命名
图片统一命名为:数字_名字.jpg
如:1_mydog.jpg, 2_mydog.jpg, 3_mydog.jpg
# 标注文字
每张图配一个 txt 文件,写上描述
如 1_mydog.txt → "a golden retriever sitting on grass, sunny day"

推荐使用 Kohya_ss GUI,是目前最成熟的 LoRA 训练工具。

# 安装 Kohya
1. 下载 Kohya_ss GUI
2. 运行 setup 脚本
3. 打开浏览器界面
# 训练流程
1. 准备素材文件夹(放训练图和标注)
2. 选择基础模型(推荐 SDXL 或 SD 1.5)
3. 设置训练参数
4. 点击 Start Training
5. 等待训练完成(约 30-60 分钟)
# 推荐参数
训练步数: 1000-2000
学习率: 1e-4
网络维度: 32
网络 alpha: 16
分辨率: 512
batch size: 2-4
优化器: AdamW8bit

AnimateDiff 扩展可以让 SD 生成短视频:

安装方式:
1. 在 Extensions 中搜索「sd-webui-animatediff」
2. 安装并重启
3. 下载 AnimateDiff 模型文件
使用方法:
1. 在 txt2img 页面开启 AnimateDiff
2. 设置帧数(16 帧 = 约 1 秒)
3. 写提示词
4. 生成后自动拼接成 GIF 或 MP4

提示词示例:

# 循环动画
prompt: blooming flower, time-lapse, petals opening, 4K, high quality
负向:ugly, blurry, low quality

Deforum 能生成更复杂的运镜动画:

适合场景:
- 镜头推进/拉远效果
- 场景过渡动画
- 旋转视角效果
- 超现实主义的连续运动
安装:Extensions → Available → 搜索「deforum」→ Install
# 推进效果
Animation Mode: 3D
Translation Z: 2 (每帧向Z轴移动)
Rotation 3D Z: 0.5 (每帧旋转)
# 平移效果
Animation Mode: 2D
Translation X: 3 (每帧向右移动)

把一张小图变得非常清晰,同时增加细节:

1. 切换到 img2img
2. 上传小图
3. 启用 ControlNet Tile
4. Upscaler: 4x-UltraSharp
5. Denoising: 0.3-0.4
6. 放大 2-4x

WebUI 内置了 SD Upscale 脚本:

1. 在 img2img 页面
2. 把图片放大到 2x
3. 找到 Script → SD Upscale
4. Tile overlap: 64
5. Scale factor: 2
6. 生成
方法效果速度推荐场景
Extras 直接放大一般简单放大
Hires.fix(文生图)同时生成+放大
img2img + ControlNet Tile最好追求极致细节
SD Upscale 脚本批量放大

在 SD 中更强大、更灵活的局部修改:

1. 在 img2img 页面
2. 上传图片
3. 用画笔涂抹要修改的区域(变成白色)
4. 建议在设置中下载专用的 Inpainting 模型
5. 写提示词描述新内容
6. 设置参数,生成
Mask blur: 4-8 ← 边缘柔化程度
Masked Content: fill ← 填充方式
Denoising: 0.75-1.0 ← 修改强度
# 移除物体
涂抹一个不需要的元素 → 提示词只写背景描述
# 修改局部
涂抹衣服区域 → 提示词改成另一件衣服的颜色/款式
# 扩展画面
涂抹图片边缘 → 提示词描述新增的内容

每次生成自动随机选择不同的关键词:

安装 Dynamic Prompts 扩展
写法示例:
{red|blue|green|yellow} dress → 每次轮换不同颜色
{summer|winter|spring|autumn} landscape → 不同季节
{1girl|1boy|1cat} → 不同主体
高级用法:
[portrait|landscape|close-up] of a person → 交替不同焦段
<cat:0.5>, <dog:0.5> → 同时有两个元素
# 混合权重
(cat:1.2) (dog:1.0) → 猫比狗更突出
(cat:0.7) (dog:1.0) → 两个元素接近
# 交替注意力
[cat|dog] in a park → 混合猫和狗的特征
# AND 语法
cat AND dog in a park → 同时有猫和狗
# 如果不是 30 系以上的显卡,开启:
Settings → Optimizations →
✅ upcast cross attention layer to float32(减少显存)
# 进一步优化:
Settings → Optimizations →
✅ Batch cond/uncond(整合计算)
# 如果显存特别小(6GB以下):
Settings → Stable Diffusion →
✅ Move VAE and CLIP to RAM when not using(共享显存)
没优化时:1 张图 60 秒
优化后:1 张图 25-35 秒
加速技巧:
1. 使用 xFormers(可加速 30-50%)
2. 关闭不用��插件
3. 降低图像尺寸
4. 减少采样步数(Euler a 15 步够用)
1. 降低图片尺寸(512x512)
2. Batch size 设为 1
3. 关闭不必要的插件
4. 使用 --medvram 或 --lowvram 参数启动
5. 更换为 SD 1.5 而非 SDXL(后者更耗显存)
1. 提高 LoRA 权重(1.0-1.2)
2. 检查基础模型是否匹配 LoRA(SD 1.5 vs SDXL)
3. 训练用的素材量是否足够
4. LoRA 本身训练质量
1. 增加帧数
2. 降低 Denoising Strength 到 0.5 以下
3. 使用 ControlNet Tile + Canny 双重控制
4. 固定种子值

完整项目工作流:从构思到成品

Section titled “完整项目工作流:从构思到成品”
第1步:灵感收集
用 Midjourney/网络搜索找到灵感参考图
第2步:模型选择
选择合适的基础模型(写实/动漫/SDXL)
第3步:ControlNet
上传参考图,用 Canny/OpenPose/Depth 锁定结构
第4步:LoRA 加持
加载相关的风格或角色 LoRA
第5步:批量尝试
Batch count 4-8,用不同种子探索
第6步:精修
选中最好的 → 固定种子 → 微调提示词
第7步:高清
Hires.fix → ControlNet Tile → Extras 放大
第8步:后期
Photoshop 微调 → 输出成品

恭喜你完成了 Stable Diffusion 全套教程!🎉

你现在已经掌握了:

  • ✅ 本地部署 SD WebUI
  • ✅ 写好正向/负向提示词
  • ✅ 权重控制与提示词技巧
  • ✅ 图生图与高清修复
  • ✅ ControlNet 六种控制方式
  • ✅ LoRA 使用与训练
  • ✅ AI 视频生成入门
  • ✅ 超分辨率与 InPainting

你已经从 SD 小白升级成了会用 SD 做生产的进阶玩家!


💡 今日练习:从 CivitAI 下载一个风格 LoRA 和一个角色 LoRA,尝试组合使用生成一组风格统一但内容不同的系列图。