输出规格与比例
图片规格这件事,很多人总是最后才想起,但它实际上应该在 prompt 之前就定好。你要的是社媒竖图、电商方图还是横版封面,决定了画面里主体放多大、留白放哪里、后续还能不能叠字。
先区分 DALL·E 和 GPT Image 的规格
OpenAI 当前文档里,这两条路线支持的尺寸并不完全一样:
GPT Image1024x10241536x10241024x1536- 也支持
auto
dall-e-31024x10241792x10241024x1792
dall-e-2256x256512x5121024x1024
所以如果你在维护旧项目,不要把 GPT Image 的规格参数直接套到 DALL·E 上。
业务里最常用的画幅思路
1:1- 方图,适合商品展示、社媒缩略图
4:5或接近竖版- 适合信息流封面、社媒主图
16:9或横版- 适合博客封面、视频缩略图、横版 Banner
9:16或接近竖版长图- 适合短视频封面和移动端故事流
不是所有比例都能直接从模型端原生给到,所以实际项目里常常还是要考虑后裁切空间。
输出格式也别忽略
按 OpenAI 当前图像文档:
- 默认输出通常是
png - 也可以请求
jpeg或webp jpeg/webp支持压缩设置- 透明背景只适用于支持透明的格式,比如
png和webp
如果你后面还要深度修图,优先保留质量更高的主文件。
如果只是网页展示或快速交付,再考虑更轻的格式。
一条实用建议
先根据发布渠道决定尺寸,再写 prompt。
不要先生成一张“看起来不错”的图,最后才发现根本塞不进页面版式。