翻车录与后期组合拳
99% 不等于 100%。
学完前 16 章你已经能稳定出图——海报、小红书、公众号、LinkedIn、Logo、IP 形象、信息图,套路都有了。但真把 gpt-image-2 拉到产线上跑一周,你会发现剩下那 1-5% 翻车率会集中爆在四个地方。这章是你的"急救手册"——四类翻车每个都给应对 prompt + 救援工作流,外加三套后期组合拳,让你从"能出图"升级到"可靠交付"。
1. 类型 1:手指 / 解剖错误
5 根手指有时画成 6 根,偶尔还会出现"两只右手"或者手指融合在一起。比 Midjourney 好太多,但仍然存在——人物特写场景大概每 10 张会翻 1 张。远景人群里手指更常翻车,但因为像素小,肉眼看不出来基本可以放过。
预防 prompt:人物特写时,约束段必须加:
anatomically correct hands, five fingers visible per hand,
no extra digits, no fused fingers, natural finger spacing
救援工作流 A:Photopea 局部 inpaint。框选错误的手部区域,用 Photopea 自带的 AI 重绘(免费),通常 2-3 次就能修对。
救援工作流 B:导回 ChatGPT 多轮编辑:
Keep everything else exactly the same.
Only fix the right hand to have 5 normal fingers,
proper anatomy, no extra digits.
模型保留其他元素,只动手部。这招对单只手最稳。
2. 类型 2:文字错乱
中文 99% 不是 100%。短标题(4-8 字)几乎不会错,但 12 字以上的长标题、复杂笔画字("嬴"、"鬱"、"龘")偶尔会笔画错乱——肉眼一扫像对的,放大 200% 才发现某个字少了一笔。
预防 prompt:双引号 + role hint + exact text only 三件套(Ch 06 详讲)。每张高质量海报出图后必须放大 200% 逐字核对。
救援工作流 A:ChatGPT 多轮修单字:
Keep everything the same. Only fix the headline:
the second character should be "学" not "字".
Use exactly the same font style and color.
救援工作流 B(最稳的兜底):Figma / Photopea 覆盖打字层。AI 出底图时强制 no text, no overlay, leave headline area clean,文字层用专业字体(思源宋体 / 阿里普惠 / 华为鸿蒙)人工打。
这套兜底为什么最稳?因为你完全绕开了 AI 文字渲染——出错率从 1% 降到 0。打个比方:与其每张图都担心 AI 写错字,不如让 AI 专心画背景,文字这种"必须 100% 对"的事交给字体文件。各司其职,谁也不抢谁的活。
3. 类型 3:版权 / 敏感词拦截
迪士尼、漫威、宝可梦、知名公众人物、政治敏感词都会被拦。常见报错是模型直接拒绝出图,或者悄悄把品牌特征"模糊化"——你想要 Mickey Mouse,给你画一只看着像但又不太像的灰色老鼠。
应对:用通用描述代替品牌名。
| 想要的 | 改成 |
|---|---|
| Mickey Mouse | a magical mouse mascot with red shorts and yellow shoes |
| Iron Man | a high-tech red and gold armored hero |
| Pokemon Pikachu | a small yellow electric creature with red cheeks |
| Steve Jobs | a Silicon Valley tech founder, black turtleneck, round glasses |
| 某明星 | a young Chinese male singer in his 20s, casual style |
公众人物一律用职业 + 国籍 + 年龄段描述,不写姓名。这样既能拿到你想要的氛围感,又不会被拦。
4. 类型 4:NSFW 拦截
OpenAI 的 NSFW 标准非常严,严到什么程度?连"穿着黑色紧身裙的女性参加酒会"这种正常商务描述都可能被拦。穿搭类账号、瑜伽课程、健身海报最容易踩坑。
应对:穿着描述保守化。
✅ casual wear / professional attire / business casual
✅ wearing a knee-length dress / wearing a fitted blazer
❌ tight / revealing / sexy / form-fitting / low-cut
国内场景比国际更保守——擦边球完全不要碰。我们做小红书时学到一个经验:与其在 prompt 里跟 OpenAI 博弈,不如直接把场景往"上班 / 通勤 / 开会"这种中性方向写,画面氛围一样到位,拦截率直接归零。
还有个隐藏坑:连续被拦 3 次以上,OpenAI 会暂时风控你的账号——后面 1-2 小时所有 prompt 都返回慢、被拦概率变高。所以一旦发现 prompt 被拦,立刻换方向重写,不要在原 prompt 上反复试。
5. 后期组合拳工作流
四类翻车都有应对方案了,但产线上你还需要"工作流"——把出图、修图、排版串成一条流水线。下面三套独立工作流,按场景挑一个用就行。
工作流 A:AI 出底图 + 人工加文字层(最稳的中文海报方案)
1. gpt-image-2 出底图
prompt 强制 "no text, no overlay, leave [区域] clean"
2. 下载到 Figma / Photopea
3. 用专业字体(思源宋体 / 阿里普惠 / 华为鸿蒙)打字层
4. 调字距 / 行距 / 字色 / 阴影
5. 导出
省掉文字翻车风险,又比纯 PS 设计快 10 倍——AI 出底图 30 秒,人工加字 3-5 分钟,单张海报 6 分钟搞定。中文密集的海报(活动 KV、电商主图、课程封面)首选这套。
工作流 B:AI 出图 + Photopea Inpaint 修局部
1. gpt-image-2 出图(整张评估 OK,只有手指 / 单字翻车)
2. Photopea 选中错误区域
3. Photopea 自带 AI 重绘 / 或导回 ChatGPT 多轮编辑
4. 导出
适合"99 分图,差 1 处"的场景。比如人物海报手指错了、单个汉字笔画错了——整张重出代价大,局部修最划算。
工作流 C:AI 出图 + Canva 模板套版
1. gpt-image-2 出底图
2. 套 Canva 现成排版模板(标题 / 副标题 / Logo 区域已规划)
3. 替换 Canva 模板默认配色与字号
4. 导出
适合非设计师快速产出。Canva 模板帮你把"什么字放哪、字多大"这件事固化了,你只管出底图 + 改字。
6. 工具速查
| 工具 | 价格 | 适合 |
|---|---|---|
| Photopea | 免费(网页 PS) | 局部修复 / 文字层 |
| Figma | 免费 / Pro $15/月 | 文字层 + 排版 |
| Canva | 免费 / Pro $13/月 | 模板套版 |
| Photoshop | $23/月 | 高级修图 / 印刷出血 |
| Affinity Photo | 一次性 $70 | PS 替代品(买断) |
没有付费工具?Photopea + Figma 免费版组合就够覆盖 90% 场景。
7. 避坑速查
把这张表打印出来贴在屏幕边——出图前对一下,翻车率立降一半。
| 翻车 | 解法关键词 |
|---|---|
| 文字错 | 双引号 + role hint + exact text only |
| 手指错 | anatomically correct hands, five fingers visible |
| 比例错 | 显式像素 1242×1660(不要写 3:4) |
| 版权拦 | 通用描述代替品牌名 |
| NSFW 拦 | 保守穿着描述(professional attire) |
| 风格漂移 | 每 2-3 张重粘完整 prompt |
| 品牌色不准 | 用 hex 码(#FF5757)代替形容词(red) |
| Logo 被覆盖 | 显式坐标(top-left 200×100 reserved) |
8. JR Academy 我们的经验
JR 团队第一次用 gpt-image-2 做春季招生物料,4 周内出了 800+ 张图(海报、小红书封面、公众号头图、LinkedIn 视觉混合)。第一周翻车率 23%——每 4 张就有 1 张要救(文字错、手指错、比例错、风格漂移占大头)。
第二周开始系统化:每个翻车类型写下应对模板、救援工作流,存到 Notion 共享给运营同事。第三周引入"放大 200% 复检"流程,复杂中文字默认走工作流 A(人工打字层)。第四周翻车率降到 6%。
关键不是模型变强,是工作流系统化。同一台 gpt-image-2,第一周和第四周的差别全在"翻车后你知道怎么修"这件事上。这件事跟做菜很像——同一口锅、同一份食材,新手翻车率高是因为没建立"盐放多了怎么救、糊锅了怎么处理"的应急本能,老手不是不犯错,是错了立刻知道下一步。
9. 一句话记忆
AI 出图 80% + 后期 20% = 可用产品。 纯靠 AI 一次出图直接发布的,下场常常是被读者一眼看穿——"AI 味"三个字一打,你的账号就贴上标签了。
把后期那 20% 当成你的护城河:手指错有 Photopea、文字错有 Figma 打字层、版权拦有通用描述、NSFW 拦有保守穿着——每个翻车类型都有兜底方案后,你出图就有"可靠交付"的底线。
10. 整个 /learn/ai-image 方向收尾
恭喜你学完 17 章。
下一步不是继续看更多教程,而是动手——选一个你最熟悉的平台(小红书 / 公众号 / LinkedIn),照着对应章节的模板量产 30 张图。出图后用本章四类翻车检查表逐项排查。
一周后回来看,你的视觉产能至少提升 3 倍。
设计这件事,从此以后不再是"卡脖子"的环节,而是你内容生产链路里最快、最可控的一段。
📷 后期增强实战案例
来自 awesome-gpt-image(CC BY 4.0)。一个真实"工作流 D:手机直出 + AI 增强"案例,比从零生成更快、更原创、更省事。
案例: iPhone 照片专业化升级(图生图工作流)
| 升级前(iPhone 直出) | 升级后(gpt-image-2 增强) |
|---|---|
Prompt:
Enhance this iPhone photo with ChatGPT so it looks like a professional photographer and designer worked on it.
这是 §5 三套工作流之外的第 4 种工作流——图生图 / 增强模式:
1. 你有一张原始照片(手机随手拍 / 旧照片 / 客户提供的低质素材)
2. 上传到 ChatGPT,配一句简单 prompt("enhance this photo")
3. gpt-image-2 保留主体 + 构图,升级光线 / 调色 / 锐度 / 细节
4. 导出
这套工作流最大的价值:原创度比纯文生图更高(你的照片是你的)+ 速度快(不用从零写 prompt)+ 翻车率几乎为 0(因为骨架来自真实照片,AI 只补氛围)。
适合场景:
- 旧手机照片要发公众号 / 小红书
- 客户提供低分辨率素材,需要"赋能"成商用
- 自己拍的产品图想升级成商业摄影感
- 朋友圈 / IG grid 内容批量升级
注意:该方法属于编辑模式,不消耗"全新生成"配额,且模型会自动避开手指 / 文字翻车(因为这些元素已经在源图里"对的",AI 不会自创)。是非常稳的兜底。
📷 创作者:@dezainaz_ceo · 收录:awesome-gpt-image
❓ 常见问题
关于本章主题最常被搜索的问题,点击展开答案
gpt-image-2 4 大翻车类型?
① 手指 / 解剖错误(5 根变 6 根)② 文字错乱(99% 不是 100%)③ 版权拦截(迪士尼 / 漫威 / 公众人物)④ NSFW 拦截(标准很严)。每类都有应对 prompt + 救援工作流。
中文字翻车怎么救?
三种代价递增:① ChatGPT 多轮编辑修单字("keep everything else, only fix character X to Y")② 重新粘完整 prompt 出图 ③ 终极兜底——Photopea / Figma 在底图上覆盖打字层(最稳)。
版权敏感词怎么绕?
用通用描述代替品牌名:"a magical mouse mascot with red shorts" 替代 "Mickey Mouse","a Silicon Valley tech founder, black turtleneck, round glasses" 替代 "Steve Jobs"。公众人物一律用职业 + 国籍 + 年龄段描述。