P

Prompt Master

Prompt 大师

掌握和 AI 对话的艺术

简介 →更多 Prompt Wiki ↗

Gemini 3

Gemini 3 Pro / Flash / Flash-Lite 概览

TL;DR（中文）

Gemini 3 是 Google 2025 旗舰：Pro 版提供 1,048,576-token 输入和 65,536-token 输出，强多模态 + 工具链；Flash 系列主打高吞吐和低成本。
典型组合：Gemini 3 Pro 处理长文档/表格/截图分析，Gemini 3 Flash 处理实时交互和批处理，Flash-Lite 覆盖最低延迟场景。
生态：AI Studio 免费层可用 Pro（限速），Vertex AI 提供企业级安全、数据驻留与调用监控。

什么时候用

超长上下文场景：产品文档、合同、日志、学术论文批注与对比。
多模态：UI 截图、流程图、图表理解与代码/配置联动。
数据密集型自动化：工具调用 + 检索 + 结构化输出（JSON/表格）。

Prompt & API 要点

明确输出模式：为结构化任务设置 JSON schema，或在 system 层写“先审查，再输出校验”。
多模态上下文：给图片/表格加文字摘要标签，避免一次上传大量无关截图。
长文档分段：分章节摘要 → 汇总，必要时让模型输出“引用标号 + 源段落”便于追踪。
成本控制：Flash/Flash-Lite 适合低延迟/高并发；Pro 用于关键步骤或校对。

对比 & 选型

与 ChatGPT 5.1：5.1 在函数调用和产品体验上更成熟；Gemini 3 在超长上下文和图像/表格解析上更具性价比。
与 Claude 4.5：Claude 在安全性和结构化写作上依旧稳健；Gemini 3 在大窗口与视觉/表格细节上占优。

常见坑

图片过多导致上下文稀释：先批量生成文字摘要，再只保留关键图。
JSON 偶发丢字段：temperature 降到 0-0.3，并在 system 中要求“输出前自检字段完整性”。
工具调用链过长：限定最大调用轮次并提供超时兜底响应。

参考