Gemini Models
Gemini 模型页最容易过时,所以更稳的写法不是堆满型号,而是先理解每条路线在真实任务里的角色。你真正上线前,仍然应该再看一次 Google 官方 models 页面确认当前可用型号。
先按路线理解,不先背型号
更实用的思路通常是:
Pro:更高能力、更适合复杂 reasoning 和重任务Flash:速度和成本更平衡,适合大多数日常生产场景Flash-Lite:更偏预算和规模Preview / Experimental:可以试,但不适合轻率写进长期生产依赖
一个更现实的选型逻辑
日常主力
如果你的任务更像日常交互、批量流程、低延迟应用,先从 Flash 路线开始 usually 更稳。
高难度任务
如果你在做:
- 复杂代码理解
- 长链路 agent
- 深度多模态分析
- 推理要求明显更高的任务
再去试 Pro 路线。
大规模低成本调用
如果你的任务更偏:
- 批处理
- 结构化抽取
- 高并发但单次请求不复杂
那 Lite 路线更值得看。
Preview 模型怎么对待更稳
Preview 模型很值得试,但不要默认它们就是长期稳定依赖。
更稳的做法通常是:
- 可以拿来 benchmark 和探索
- 不要轻易写死到生产默认路由
- 先准备 fallback 和 migration 方案
一个接近真实工作的建议
很多团队模型选型做复杂了,其实是因为一开始就在问“哪个公司最强”。更有用的问法通常是:
- 这个任务是否真的需要 Pro
- 如果换成 Flash,结果会差多少
- 差出来的那部分,值不值得那笔成本
上线前至少做一次对比测试
如果你已经选出候选模型,建议至少做一轮自己的小 benchmark:
- 选 10 到 20 个真实任务样本
- 用候选模型各跑一遍
- 记录质量、延迟、成本和结构化输出稳定性
- 再决定默认模型