改图与风格统一
改图与风格统一
大多数商业内容不是输在 first draft,而是输在最后那 20% 的 image editing。AI 先出一张图不难,难的是把它改到能进 campaign、能进 product page、能跟现有 brand asset 放在一起还不违和。如果没有 editing workflow,AI 出图越快,返工通常也越快。
这页重点不是“炫技参数”,而是教你怎么从 random edits 走到可控的 visual revision。
先说结论:改图的核心不是改得多,而是改得准
最常见的错误是一次想改完背景、表情、服装、构图、光线。结果模型每次都会顺手把别的地方也改坏。
更稳的原则只有两个:
- 一次只改一个决策层
- 先锁住不该变的部分
你把这两个原则守住,返工会少很多。
改图不是一个功能,而是 4 类任务
| 任务类型 | 你在解决什么问题 | 常用方法 |
|---|---|---|
| Cleanup | 去路人、去杂物、修细节 | inpainting, erase, heal |
| Replacement | 换背景、换物件、换服装 | mask + prompt |
| Extension | 扩比例、补场景、补留白 | outpainting, expand |
| Consistency | 保持角色、材质、风格一致 | reference image, seed, style lock |
很多人把这 4 类混在一起提 prompt,模型当然容易失控。
一个更可控的 Editing Flow
Base image
-> Decide what must stay
-> Mask / reference setup
-> Single-purpose edit
-> Consistency check
-> Export variants
这里最重要的是第二步。
如果你自己都没定义“什么必须保留”,AI 不可能替你保留。
哪些元素应该先锁住
商业场景里,通常优先锁这些元素:
| 必锁元素 | 为什么 |
|---|---|
| product shape | 电商图最怕把产品本身改形 |
| logo / typography | 一旦变形就不能商用 |
| face identity | 人像 campaign 最怕人物变脸 |
| brand palette | 风格一乱,整组 asset 不统一 |
| composition hierarchy | 主体和留白位置决定后续排版 |
如果你做的是 ad creative,甚至要先决定哪个区域给 headline,哪个区域留 CTA,再去做扩图或换背景。
Inpainting 什么时候最值钱
Inpainting 不是“修一块区域”这么简单,它最适合解决这些问题:
- 产品边缘不干净
- 模特手部、耳环、袖口细节崩了
- 背景里多了干扰物
- 你只想换一个局部元素,不想整张重做
一个经验规则是:mask 不要抠得过窄。
如果只框住坏掉的手指,模型往往接不上。稍微带一点周围上下文,融合会更自然。
Outpainting 不是补画布,而是在重做构图
很多人把 outpainting 当作“自动扩边”。这理解太浅。
真实业务里,outpainting 常用在这几类需求:
| 场景 | 目标 |
|---|---|
| 1:1 变 16:9 | 给 hero banner 留文案位 |
| 4:5 变 9:16 | 做 short video 封面或 story |
| 头像变半身 | 补肢体语言和场景信息 |
| 产品 close-up 变 lifestyle scene | 增加商业感和 narrative |
如果没有提前规划 copy placement,扩图很容易扩成“画面更大,但更没用”。
风格统一,靠的是 Reference System
同一组内容里最难的不是单张图好看,而是 6 张图放在一起像一套东西。
建议至少固定这 4 项:
| 控制项 | 例子 |
|---|---|
| color direction | warm neutral / cool tech / dark luxury |
| lens feeling | close-up、35mm、top-down、wide shot |
| material language | matte, chrome, glass, paper grain |
| post-processing | film grain, soft contrast, sharp commercial finish |
这套 reference system 比“换个更强模型”更重要。模型换了,系统不变,结果还稳;系统没有,模型再强也会飘。
实战例子 1:电商产品图换背景
原始需求:保留产品形态,只把普通桌面换成更高级的 campaign background。
更好的操作顺序:
- 锁定 bottle / packaging 不动
- mask 掉背景和阴影过杂区域
- prompt 只描述新环境,不重复描述产品
- 出 3-4 个 background variant
- 最后统一 shadow 和 color grade
如果你在 prompt 里又写产品材质、又写背景、又写灯光,模型很可能连产品一起重画。
实战例子 2:人物视觉保持同一张脸
这是内容团队最常见的痛点。
“同一个角色做系列内容,但每张都像不同人。”
可行做法:
| 方法 | 作用 |
|---|---|
| reference face | 锁基本五官和发型 |
| fixed styling notes | 固定妆发、服装、配色 |
| shot list | 先定义 close-up / medium / full body |
| batch review | 一次对比 4-6 张,而不是单张看 |
不要一张一张生成后再凭感觉挑。系列内容一定要用 batch review。
实战例子 3:把静态图改成适合投放的 Ad Visual
很多原图“好看”,但不适合广告,因为没有文案位、没有层次、主体太散。
你可以这样改:
Goal:
Create a cleaner paid-ad visual with clear negative space on the right side.
Keep:
- product shape
- front label
- overall luxury tone
Change:
- simplify background
- increase contrast around the product
- leave copy space on the right
这类 brief 比单纯写“make it more premium”有效得多。
常见翻车点
| 问题 | 原因 | 修法 |
|---|---|---|
| 越改越不像原图 | 一次改太多层 | 分两轮 edit |
| 边缘脏、融合假 | mask 太紧或太硬 | 带一点周边上下文 |
| 同系列风格漂移 | 每张图各写各的 prompt | 先固定 reference system |
| 广告图没法排版 | 没预留 copy space | 先做 layout planning |
Human Review Checklist
- 这次 edit 的目标是否只有一个主目标
- 产品、logo、人物 identity 有没有被误改
- 这张图跟同系列其他资产放一起是否 still consistent
- 是否留出了文案和 CTA 的空间
- 如果要商用,文字、logo、版权元素是否安全
Practice
拿一张你已有的 product image,不要重新生成。只做下面一轮 edit:
- 保留主体
- 只换背景
- 留出一块 headline 区域
- 输出 3 个 variant 比较
这类练习最能帮你建立“商业改图”而不是“玩模型”的感觉。