Prompt 框架
写 DALL·E 或 GPT Image prompt 时,最有用的不是堆很多“高级形容词”,而是把信息按顺序说清楚。顺序一乱,模型就容易抓错重点。
一个够用的基础框架
用途 + 主体 + 场景 + 风格 + 光线/材质 + 构图 + 比例
这比单纯写“主体 + 场景 + 风格”更稳,因为它把真正影响可用性的两个因素也带进来了:
- 用途
- 构图
为什么要把“用途”放最前面
同一个 prompt,如果用途不同,结果要求会完全不同。
比如:
- 电商图要主体清楚
- 封面图要留标题空间
- 广告图要更强视觉冲击
- 教程配图则更强调信息清楚
用途一旦不清楚,模型就容易产出“好看但不好用”的图片。
一个可复用模板
请生成一张用于[用途]的图片。
主体是[主体],位于[场景]中。
整体风格偏[风格],光线/材质表现为[描述]。
构图要求[构图要求],输出为[比例或方向]。
示例
请生成一张用于博客封面的图片。
主体是一台打开的笔记本电脑,位于安静的家庭办公桌上。
整体风格偏现代科技感,冷色调,柔和侧光。
构图要求主体在左侧,右侧预留标题空间,横版封面。
哪些 prompt 最容易写坏
- 只给风格,不给用途
- 一句话塞进太多互相冲突的要求
- 同时要求极简、复杂、写实、梦幻、电影感
- 不说明哪些元素必须保留,哪些只是加分项
一个更稳的做法
先写“必须有”的信息,再写“最好有”的信息。
这样模型抓主次会更稳,也更方便后面迭代。