logo
17

翻车录与后期组合拳

⏱️ 20分钟

99% 不等于 100%。

学完前 16 章你已经能稳定出图——海报、小红书、公众号、LinkedIn、Logo、IP 形象、信息图,套路都有了。但真把 gpt-image-2 拉到产线上跑一周,你会发现剩下那 1-5% 翻车率会集中爆在四个地方。这章是你的"急救手册"——四类翻车每个都给应对 prompt + 救援工作流,外加三套后期组合拳,让你从"能出图"升级到"可靠交付"。


1. 类型 1:手指 / 解剖错误

5 根手指有时画成 6 根,偶尔还会出现"两只右手"或者手指融合在一起。比 Midjourney 好太多,但仍然存在——人物特写场景大概每 10 张会翻 1 张。远景人群里手指更常翻车,但因为像素小,肉眼看不出来基本可以放过。

预防 prompt:人物特写时,约束段必须加:

anatomically correct hands, five fingers visible per hand,
no extra digits, no fused fingers, natural finger spacing

救援工作流 A:Photopea 局部 inpaint。框选错误的手部区域,用 Photopea 自带的 AI 重绘(免费),通常 2-3 次就能修对。

救援工作流 B:导回 ChatGPT 多轮编辑:

Keep everything else exactly the same.
Only fix the right hand to have 5 normal fingers,
proper anatomy, no extra digits.

模型保留其他元素,只动手部。这招对单只手最稳。


2. 类型 2:文字错乱

中文 99% 不是 100%。短标题(4-8 字)几乎不会错,但 12 字以上的长标题、复杂笔画字("嬴"、"鬱"、"龘")偶尔会笔画错乱——肉眼一扫像对的,放大 200% 才发现某个字少了一笔。

预防 prompt:双引号 + role hint + exact text only 三件套(Ch 06 详讲)。每张高质量海报出图后必须放大 200% 逐字核对

救援工作流 A:ChatGPT 多轮修单字:

Keep everything the same. Only fix the headline:
the second character should be "学" not "字".
Use exactly the same font style and color.

救援工作流 B(最稳的兜底):Figma / Photopea 覆盖打字层。AI 出底图时强制 no text, no overlay, leave headline area clean,文字层用专业字体(思源宋体 / 阿里普惠 / 华为鸿蒙)人工打。

这套兜底为什么最稳?因为你完全绕开了 AI 文字渲染——出错率从 1% 降到 0。打个比方:与其每张图都担心 AI 写错字,不如让 AI 专心画背景,文字这种"必须 100% 对"的事交给字体文件。各司其职,谁也不抢谁的活。


3. 类型 3:版权 / 敏感词拦截

迪士尼、漫威、宝可梦、知名公众人物、政治敏感词都会被拦。常见报错是模型直接拒绝出图,或者悄悄把品牌特征"模糊化"——你想要 Mickey Mouse,给你画一只看着像但又不太像的灰色老鼠。

应对:用通用描述代替品牌名。

想要的改成
Mickey Mousea magical mouse mascot with red shorts and yellow shoes
Iron Mana high-tech red and gold armored hero
Pokemon Pikachua small yellow electric creature with red cheeks
Steve Jobsa Silicon Valley tech founder, black turtleneck, round glasses
某明星a young Chinese male singer in his 20s, casual style

公众人物一律用职业 + 国籍 + 年龄段描述,不写姓名。这样既能拿到你想要的氛围感,又不会被拦。


4. 类型 4:NSFW 拦截

OpenAI 的 NSFW 标准非常严,严到什么程度?连"穿着黑色紧身裙的女性参加酒会"这种正常商务描述都可能被拦。穿搭类账号、瑜伽课程、健身海报最容易踩坑。

应对:穿着描述保守化。

✅ casual wear / professional attire / business casual
✅ wearing a knee-length dress / wearing a fitted blazer
❌ tight / revealing / sexy / form-fitting / low-cut

国内场景比国际更保守——擦边球完全不要碰。我们做小红书时学到一个经验:与其在 prompt 里跟 OpenAI 博弈,不如直接把场景往"上班 / 通勤 / 开会"这种中性方向写,画面氛围一样到位,拦截率直接归零。

还有个隐藏坑:连续被拦 3 次以上,OpenAI 会暂时风控你的账号——后面 1-2 小时所有 prompt 都返回慢、被拦概率变高。所以一旦发现 prompt 被拦,立刻换方向重写,不要在原 prompt 上反复试。


5. 后期组合拳工作流

四类翻车都有应对方案了,但产线上你还需要"工作流"——把出图、修图、排版串成一条流水线。下面三套独立工作流,按场景挑一个用就行。

工作流 A:AI 出底图 + 人工加文字层(最稳的中文海报方案)

1. gpt-image-2 出底图
   prompt 强制 "no text, no overlay, leave [区域] clean"
2. 下载到 Figma / Photopea
3. 用专业字体(思源宋体 / 阿里普惠 / 华为鸿蒙)打字层
4. 调字距 / 行距 / 字色 / 阴影
5. 导出

省掉文字翻车风险,又比纯 PS 设计快 10 倍——AI 出底图 30 秒,人工加字 3-5 分钟,单张海报 6 分钟搞定。中文密集的海报(活动 KV、电商主图、课程封面)首选这套。

工作流 B:AI 出图 + Photopea Inpaint 修局部

1. gpt-image-2 出图(整张评估 OK,只有手指 / 单字翻车)
2. Photopea 选中错误区域
3. Photopea 自带 AI 重绘 / 或导回 ChatGPT 多轮编辑
4. 导出

适合"99 分图,差 1 处"的场景。比如人物海报手指错了、单个汉字笔画错了——整张重出代价大,局部修最划算。

工作流 C:AI 出图 + Canva 模板套版

1. gpt-image-2 出底图
2. 套 Canva 现成排版模板(标题 / 副标题 / Logo 区域已规划)
3. 替换 Canva 模板默认配色与字号
4. 导出

适合非设计师快速产出。Canva 模板帮你把"什么字放哪、字多大"这件事固化了,你只管出底图 + 改字。


6. 工具速查

工具价格适合
Photopea免费(网页 PS)局部修复 / 文字层
Figma免费 / Pro $15/月文字层 + 排版
Canva免费 / Pro $13/月模板套版
Photoshop$23/月高级修图 / 印刷出血
Affinity Photo一次性 $70PS 替代品(买断)

没有付费工具?Photopea + Figma 免费版组合就够覆盖 90% 场景。


7. 避坑速查

把这张表打印出来贴在屏幕边——出图前对一下,翻车率立降一半。

翻车解法关键词
文字错双引号 + role hint + exact text only
手指错anatomically correct hands, five fingers visible
比例错显式像素 1242×1660(不要写 3:4)
版权拦通用描述代替品牌名
NSFW 拦保守穿着描述(professional attire)
风格漂移每 2-3 张重粘完整 prompt
品牌色不准用 hex 码(#FF5757)代替形容词(red)
Logo 被覆盖显式坐标(top-left 200×100 reserved)

8. JR Academy 我们的经验

JR 团队第一次用 gpt-image-2 做春季招生物料,4 周内出了 800+ 张图(海报、小红书封面、公众号头图、LinkedIn 视觉混合)。第一周翻车率 23%——每 4 张就有 1 张要救(文字错、手指错、比例错、风格漂移占大头)。

第二周开始系统化:每个翻车类型写下应对模板、救援工作流,存到 Notion 共享给运营同事。第三周引入"放大 200% 复检"流程,复杂中文字默认走工作流 A(人工打字层)。第四周翻车率降到 6%。

关键不是模型变强,是工作流系统化。同一台 gpt-image-2,第一周和第四周的差别全在"翻车后你知道怎么修"这件事上。这件事跟做菜很像——同一口锅、同一份食材,新手翻车率高是因为没建立"盐放多了怎么救、糊锅了怎么处理"的应急本能,老手不是不犯错,是错了立刻知道下一步。


9. 一句话记忆

AI 出图 80% + 后期 20% = 可用产品。 纯靠 AI 一次出图直接发布的,下场常常是被读者一眼看穿——"AI 味"三个字一打,你的账号就贴上标签了。

把后期那 20% 当成你的护城河:手指错有 Photopea、文字错有 Figma 打字层、版权拦有通用描述、NSFW 拦有保守穿着——每个翻车类型都有兜底方案后,你出图就有"可靠交付"的底线。


10. 整个 /learn/ai-image 方向收尾

恭喜你学完 17 章。

下一步不是继续看更多教程,而是动手——选一个你最熟悉的平台(小红书 / 公众号 / LinkedIn),照着对应章节的模板量产 30 张图。出图后用本章四类翻车检查表逐项排查。

一周后回来看,你的视觉产能至少提升 3 倍。

设计这件事,从此以后不再是"卡脖子"的环节,而是你内容生产链路里最快、最可控的一段。


📷 后期增强实战案例

来自 awesome-gpt-image(CC BY 4.0)。一个真实"工作流 D:手机直出 + AI 增强"案例,比从零生成更快、更原创、更省事。

案例: iPhone 照片专业化升级(图生图工作流)

升级前(iPhone 直出)升级后(gpt-image-2 增强)
BeforeAfter

Prompt:

Enhance this iPhone photo with ChatGPT so it looks like a professional photographer and designer worked on it.

这是 §5 三套工作流之外的第 4 种工作流——图生图 / 增强模式

1. 你有一张原始照片(手机随手拍 / 旧照片 / 客户提供的低质素材)
2. 上传到 ChatGPT,配一句简单 prompt("enhance this photo")
3. gpt-image-2 保留主体 + 构图,升级光线 / 调色 / 锐度 / 细节
4. 导出

这套工作流最大的价值:原创度比纯文生图更高(你的照片是你的)+ 速度快(不用从零写 prompt)+ 翻车率几乎为 0(因为骨架来自真实照片,AI 只补氛围)。

适合场景:

  • 旧手机照片要发公众号 / 小红书
  • 客户提供低分辨率素材,需要"赋能"成商用
  • 自己拍的产品图想升级成商业摄影感
  • 朋友圈 / IG grid 内容批量升级

注意:该方法属于编辑模式,不消耗"全新生成"配额,且模型会自动避开手指 / 文字翻车(因为这些元素已经在源图里"对的",AI 不会自创)。是非常稳的兜底。

📷 创作者:@dezainaz_ceo · 收录:awesome-gpt-image

❓ 常见问题

关于本章主题最常被搜索的问题,点击展开答案

gpt-image-2 4 大翻车类型?

① 手指 / 解剖错误(5 根变 6 根)② 文字错乱(99% 不是 100%)③ 版权拦截(迪士尼 / 漫威 / 公众人物)④ NSFW 拦截(标准很严)。每类都有应对 prompt + 救援工作流。

中文字翻车怎么救?

三种代价递增:① ChatGPT 多轮编辑修单字("keep everything else, only fix character X to Y")② 重新粘完整 prompt 出图 ③ 终极兜底——Photopea / Figma 在底图上覆盖打字层(最稳)。

版权敏感词怎么绕?

用通用描述代替品牌名:"a magical mouse mascot with red shorts" 替代 "Mickey Mouse","a Silicon Valley tech founder, black turtleneck, round glasses" 替代 "Steve Jobs"。公众人物一律用职业 + 国籍 + 年龄段描述。