lora训练真人模型指令怎么写？踩坑7年后我告诉你真相

发布时间：2026/5/13 21:29:20

别再去网上抄那些通用的提示词模板了，根本没用。我做了7年大模型，见过太多人拿着LoRA模型却训练出“鬼影”或者脸崩的图，全是提示词没写对。这篇东西不整虚的，直接给你我能落地的核心逻辑，看完你至少能避开80%的新手坑。

先说个真事。上个月有个粉丝找我哭诉，说他辛苦攒了50张高清写真，训练出来的LoRA模型，一用就变样。我一看他的训练集，好家伙，全是不同光线、不同角度的照片，但他给的指令全是“美女，高清，8k分辨率”这种废话。结果呢？模型根本学不到那个人的特征，只学会了“模糊的美女”。这就像你让一个学生背整本字典，却不告诉他重点在哪，他能考高分才怪。

很多人对“指令”的理解有偏差，以为指令就是用来描述画面的形容词。错！在LoRA训练中，指令（Caption）的核心作用是“去噪”和“锚定”。你要告诉模型，这张图里什么是背景（噪音），什么是主体（锚点）。

我现在的做法非常简单粗暴。第一步，清理数据。千万别偷懒，把照片里的人脸抠出来，或者用标签工具把无关背景标上“background”、“blurry”、“noise”。第二步，写核心指令。别用长难句，就用名词堆叠。比如你要训练一个穿红裙子的女孩，指令就是“red dress, girl, solo, looking at viewer”。注意，这里千万不要加“beautiful”、“pretty”这种主观形容词，模型根本不在乎你觉不觉得她美，它只在乎像素分布。

这里有个关键点，很多人容易忽略：负面提示词（Negative Prompt）的重要性不亚于正面指令。如果你训练的是真人，一定要在负面提示里加上“ugly, deformed, extra limbs, bad anatomy”。我试过不加，结果训练出来的模型，手经常多出一根手指，或者脸直接融化。这真的让人想砸电脑。

再分享一个进阶技巧：权重控制。在写指令时，给关键特征加括号或者调整权重。比如你想强调眼睛的特征，可以写成“(eyes:1.2)”。这个“1.2”就是权重，数字越大，模型越关注这个特征。但我建议新手别搞太复杂，1.0到1.3之间足矣。搞太高，画面会过拟合，稍微换个姿势就崩。

还有，别迷信那些所谓的“独家秘籍”。LoRA训练的本质是概率匹配。你的指令写得越精准，模型学到的特征就越纯粹。我见过有人用几百字描述一张照片，结果模型完全懵逼，最后训练出来一塌糊涂。记住，少即是多。

最后，总结一下。写指令就三件事：1. 描述主体（谁，穿什么，什么动作）；2. 剔除背景（用标签或负面提示）；3. 控制权重（关键特征加粗）。别整那些花里胡哨的，老老实实标注数据，比什么技巧都管用。

如果你按照这个思路去改你的指令，发现效果还是不行，那大概率是你的训练参数（Epoch, Batch Size）没调好，或者数据本身质量太差。但无论如何，先把指令写对，这是第一步。

本文关键词：lora训练真人模型指令