03
图像生成与构图技巧
图像生成与构图技巧
图像生成不仅是点击“生成”按钮,更是一个将抽象创意转化为精准视觉语言的过程。掌握 AI 图像生成,意味着你需要学会如何控制构图、风格、光影与叙事细节。
什么是 AI 图像生成?
AI 图像生成主要基于扩散模型 (Diffusion Models) 技术。简单来说,AI 学习了海量图片与文字的对应关系,通过从“噪声”中逐渐还原出符合描述的像素,最终合成图片。
┌─────────────────────────────────────────────────────────────┐ │ 图像生成的基本逻辑 │ ├─────────────────────────────────────────────────────────────┤ │ │ │ 文本指令 (Prompt) → 特征提取 → 噪声消除 → 最终图像 │ │ [你的描述] [理解语义] [像素重组] [视觉呈现] │ │ │ └─────────────────────────────────────────────────────────────┘
为什么图像生成对你很重要?
| 应用场景 | 具体用途 | 业务价值 |
|---|---|---|
| 电商营销 | 生成产品模特图、场景图 | 降低 80% 拍摄成本,快速出图 |
| 内容运营 | 社媒配图、文章插图、封面 | 告别版权风险,风格高度统一 |
| UI/UX 设计 | 图标生成、背景纹理、原型素材 | 加速创意碰撞,快速产出占位图 |
| 个人品牌 | 个人头像、数字艺术创作 | 零绘画基础实现专业级视觉表达 |
核心 Prompt 框架:万能公式
想要生成的图片“听话”,你需要一个结构化的 Prompt。建议参考以下公式:
[主体] + [动作/状态] + [环境/背景] + [风格/媒介] + [构图/镜头] + [光影/色调] + [高质量修饰词]
维度拆解:
- 主体 (Subject): 画面中心是谁?(例如:一个戴墨镜的宇航员)
- 风格 (Style): 摄影、油画、3D 渲染、吉卜力动漫、赛博朋克?
- 构图 (Composition): 特写 (Close-up)、俯拍 (Top view)、黄金分割 (Rule of thirds)?
- 光影 (Lighting): 电影感光效 (Cinematic lighting)、丁达尔效应 (Tyndall effect)、夕阳漫反射?
常用 AI 图像工具对比
| 工具 | 优势 | 适用人群 |
|---|---|---|
| Midjourney | 艺术感极强,构图审美一流 | 设计师、数字艺术家 |
| DALL-E 3 | 指令理解最强,支持中文输入 | 初学者、快速配图需求 |
| Stable Diffusion | 插件丰富 (ControlNet),完全可控 | 技术发烧友、商业工作流定制 |
| Flux | 真实感极高,文字渲染效果好 | 写实摄影、平面设计 |
Quick Start:第一个高质 Prompt
尝试在 Midjourney 或 DALL-E 3 中输入:
A futuristic coffee shop on Mars, red dust outside the window,
earth visible in the sky, cinematic lighting, ultra-realistic, 8k, --ar 16:9
场景示例 1-5
示例 1:电商产品图(极简风)
- Prompt:
A high-end glass perfume bottle on a smooth white marble surface, soft morning sunlight through a window, minimalist aesthetic, 8k resolution, product photography style. - 关键点: 强调材质(玻璃、大理石)和光影(早晨阳光)。
示例 2:人物人像(电影感)
- Prompt:
Close-up portrait of an elderly fisherman with a weathered face, intense blue eyes, rainy harbor background, cinematic lighting, moody atmosphere, shot on 35mm film. - 关键点: 使用镜头语言(35mm film)和细节描述(weathered face)。
示例 3:二次元动漫(吉卜力风格)
- Prompt:
A peaceful summer meadow with a small cottage, white fluffy clouds, vibrant colors, Studio Ghibli art style, hand-drawn texture, peaceful mood. - 关键点: 直接调用特定艺术家或工作室风格。
示例 4:室内设计(北欧风)
- Prompt:
Modern Scandinavian living room, large windows, cozy fireplace, neutral color palette, architectural photography, symmetrical composition, daylight. - 关键点: 强调构图方式(Symmetrical composition)。
示例 5:科幻视觉(赛博朋克)
- Prompt:
Neon-drenched streets of a futuristic Tokyo, heavy rain, reflections on the wet ground, cyberpunk aesthetic, pink and teal color palette, wide-angle shot. - 关键点: 确定特定的色调(Pink and teal)。
进阶技巧:如何精准微调?
- 负向提示 (Negative Prompt): 明确告诉 AI “不要”什么(如:
--no blur, low quality, extra limbs)。 - 比例控制 (Aspect Ratio): 在 Midjourney 中使用
--ar 16:9或--ar 9:16。 - 权重调整 (Weight): 使用
::强调某些词的重要性(如:mountain::2 clouds::1)。 - 垫图 (Image Prompt): 上传参考图,让 AI 学习参考图的构图或色彩。
- 风格参考 (SREF): Midjourney 的
--sref功能可以复刻特定图片的风格。
常见问题与解决方案
| 问题 | 原因 | 解决方案 |
|---|---|---|
| 主体模糊不清 | Prompt 描述太泛 | 增加具体的细节词和纹理词 |
| 手部结构扭曲 | AI 对解剖学理解有限 | 使用 Negative Prompt 或改图工具修复 |
| 风格不统一 | 每次生成的风格词变动 | 固定一套“风格关键词”作为模板 |
| 背景太乱 | 缺乏空间引导词 | 加入 "simple background" 或 "bokeh" (背景虚化) |
动手练习
- 模仿练习: 找一张你喜欢的电影海报,试着用公式拆解它的 Prompt 并重新生成。
- 变量替换: 将“示例 1”中的香水瓶替换成“运动鞋”或“智能手表”,观察光影如何影响产品质感。
- 风格混搭: 尝试用“赛博朋克”风格生成一张“古代中国园林”的图片。
相关阅读
小结
- 构图是灵魂: 决定了观众看哪里的视觉引导。
- 公式是基础: 主体 + 环境 + 风格 + 镜头,缺一不可。
- 工具选对路: Midjourney 选审美,DALL-E 选逻辑,SD 选控制。
- 迭代是常态: 极少有一次生成的完美图,学会微调 Prompt 才是核心竞争力。
- 细节决定质感: 材质、光影、镜头参数是区分小白与高手的关键。