Gemini 3
Gemini 3 Pro / Flash / Flash-Lite 概览
TL;DR(中文)
- Gemini 3 是 Google 2025 旗舰:Pro 版提供 1,048,576-token 输入和 65,536-token 输出,强多模态 + 工具链;Flash 系列主打高吞吐和低成本。
- 典型组合:
Gemini 3 Pro处理长文档/表格/截图分析,Gemini 3 Flash处理实时交互和批处理,Flash-Lite覆盖最低延迟场景。 - 生态:AI Studio 免费层可用 Pro(限速),Vertex AI 提供企业级安全、数据驻留与调用监控。
什么时候用
- 超长上下文场景:产品文档、合同、日志、学术论文批注与对比。
- 多模态:UI 截图、流程图、图表理解与代码/配置联动。
- 数据密集型自动化:工具调用 + 检索 + 结构化输出(JSON/表格)。
Prompt & API 要点
- 明确输出模式:为结构化任务设置 JSON schema,或在 system 层写“先审查,再输出校验”。
- 多模态上下文:给图片/表格加文字摘要标签,避免一次上传大量无关截图。
- 长文档分段:分章节摘要 → 汇总,必要时让模型输出“引用标号 + 源段落”便于追踪。
- 成本控制:Flash/Flash-Lite 适合低延迟/高并发;Pro 用于关键步骤或校对。
对比 & 选型
- 与 ChatGPT 5.1:5.1 在函数调用和产品体验上更成熟;Gemini 3 在超长上下文和图像/表格解析上更具性价比。
- 与 Claude 4.5:Claude 在安全性和结构化写作上依旧稳健;Gemini 3 在大窗口与视觉/表格细节上占优。
常见坑
- 图片过多导致上下文稀释:先批量生成文字摘要,再只保留关键图。
- JSON 偶发丢字段:temperature 降到 0-0.3,并在 system 中要求“输出前自检字段完整性”。
- 工具调用链过长:限定最大调用轮次并提供超时兜底响应。