Gemini 简介(同步到 2025-12)
Gemini 是 Google 的多模态模型系列,最新已发布 Gemini 2.5 Pro / 2.5 Flash,并提供 Gemini 3 Pro/Flash 预览 与原生音频/视频/图片生成能力。官方模型清单与示例来自 Google AI for Developers↗。
#为什么使用 Gemini?
#1. 原生多模态能力
Gemini 从设计之初就是多模态的:
- 理解图片、PDF、视频
- 分析音频内容
- 文本生成和理解
- 代码生成和解释
#2. 超长上下文
| 模型 | 上下文长度(官方标称) |
|---|---|
| Gemini 2.5 Pro | 2M tokens |
| Gemini 2.5 Flash | 2M tokens(支持图像/视频输入) |
| Gemini 2.0 Flash | 1M+ tokens |
2M tokens ≈ 150 万字 ≈ 2 小时视频
#最新模型速查(2025-12)
- Gemini 2.5 Pro / 2.5 Flash:主力生产模型,2M 上下文,覆盖文本/图像/音频/视频,Flash 兼顾价格与延迟。
- Gemini 3 Pro / 3 Flash(预览):新一代预览,适合评估迁移和能力对比。
- 语音/流式:
gemini-2.5-flash-live,gemini-2.5-flash-native-audio-preview-*。 - 图片生成:
gemini-2.5-flash-image-preview支持生成图像。 - 端侧:Gemini Nano 面向 Android / 设备端推理。
#3. 与 Google 生态集成
- Google Workspace 集成
- Google Cloud 原生支持
- Android 深度集成
#Gemini 模型对比(2025-12)
| 模型 | 特点 | 适用场景 |
|---|---|---|
| Gemini 3 Pro(预览) | 最新预览,强化推理与多模态 | 尝鲜新特性、评估迁移 |
| Gemini 3 Flash(预览) | 最新预览,低延迟 | 即时交互、轻量应用 |
| Gemini 2.5 Pro | 最强通用/多模态,2M tokens | 复杂推理、长文档/视频、代码 |
| Gemini 2.5 Flash | 高性价比、也支持 2M tokens、图像/视频输入 | 批量/实时多模态、产品内嵌 |
| Gemini 2.0 Flash / Flash Lite | 成本更低的长上下文 | 高并发/低成本场景 |
| Gemini Nano | 端侧/移动 | 设备内推理 |
#模型 ID 速查(API 参数)
| 用途 | 推荐 model id | 备注 |
|---|---|---|
| 通用多模态推理 | gemini-2.5-pro | 长上下文,高质量输出 |
| 高性价比多模态 | gemini-2.5-flash | 2M ctx,图/音/视频输入 |
| 语音/流式 | gemini-2.5-flash-live | 低延迟语音/流式 |
| TTS/音频输出 | gemini-2.5-pro-tts / gemini-2.5-flash-tts | 语音合成 |
| 图片生成 | gemini-2.5-flash-image-preview | 预览版 |
| 预览评估 | gemini-3-pro / gemini-3-flash | 新一代预览 |
| 低成本 | gemini-2.0-flash / gemini-2.0-flash-lite | 1M+ ctx |
以上 ID 来自官方模型列表;可用性随区域/账户变化,发布/下线请查官方 deprecations。
#接入渠道
- Google AI Studio:Playground + 生成 API Key,支持导出代码。
- Gemini API(开发者 Key):适合前后端直接调用,请妥善保管 Key。
- Vertex AI:企业级(VPC、私有服务接入、计费集中、数据驻留/合规)。
- Workspace / Chrome / Android:面向消费或轻量协作的前端入口。
#使用方式
#1. Google AI Studio
- 免费使用额度
- 可视化测试界面
- 直接获取 API Key
#2. Gemini App
- 免费基础版
- Gemini Advanced ($20/月)
- 移动端 App 支持
#3. API 调用
pythonimport google.generativeai as genai genai.configure(api_key="YOUR_API_KEY") model = genai.GenerativeModel("gemini-2.5-pro") response = model.generate_content("解释量子计算的核心原理,用 5 行总结") print(response.text)
#核心能力
#文本生成
pythonmodel = genai.GenerativeModel("gemini-2.5-pro") response = model.generate_content(""" 分析以下代码的时间复杂度,并给出 O 表示、可能的优化建议: def fibonacci(n): if n <= 1: return n return fibonacci(n-1) + fibonacci(n-2) """)
#图像理解
pythonimport PIL.Image image = PIL.Image.open("diagram.png") response = model.generate_content([ "解释这张架构图", image ])
#视频分析
pythonvideo_file = genai.upload_file("lecture.mp4") response = model.generate_content([ "总结这个视频的主要内容", video_file ])
#代码生成
Gemini 在代码任务上表现优秀:
- 支持多种编程语言
- 理解复杂代码逻辑
- 生成文档和测试
#工具调用 / 结构化输出
pythontools = [ { "name": "get_weather", "description": "获取城市天气", "parameters": { "type": "object", "properties": {"city": {"type": "string"}}, "required": ["city"], }, } ] model = genai.GenerativeModel("gemini-2.5-flash") resp = model.generate_content( [{"text": "北京现在的天气如何?"}], tools=tools, generation_config={ "response_mime_type": "application/json", "max_output_tokens": 256, }, ) print(resp.candidates[0].content)
#Gemini vs 同类(简版参考)
| 特性 | Gemini 2.5 Pro | GPT-4.x | Claude 4.5 | 备注 |
|---|---|---|---|---|
| 上下文 | 2M | 128K+ | 200K | 2M 适合长文档/视频 |
| 多模态 | ✅ 文/图/音/视频 | ✅ 文/图/音 | ✅ 文/图 | 视频是 Gemini 优势 |
| 语音/流式 | ✅ 原生音频/多模态流式 | ✅ | ✅ | Gemini 2.5 Flash/Live 支持 |
| 代码 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | 长上下文代码分析 Gemini 有优势 |
| 价格 | 参考官方定价 | - | - | 最新价格见官方页面 |
#Gemini Advanced(消费端)
$20/月 获得:
- 直接使用 Gemini 2.5 Pro(面向消费者)
- 2TB Google One 存储
- Google Workspace 集成
- 移动/网页端 App,优先体验新特性
#最佳实践
#1. 利用多模态
python# 同时处理多种输入 response = model.generate_content([ "根据这张设计稿和需求文档,生成 React 组件代码", design_image, requirements_pdf ])
#2. 利用长上下文
python# 一次性分析整个代码库 with open("codebase.txt") as f: code = f.read() # 可以很长! response = model.generate_content(f""" 分析以下代码库的架构,找出潜在的性能问题: {code} """)
#3. 结构化输出
pythonresponse = model.generate_content( "列出 Python 的 10 个最佳实践", generation_config={"response_mime_type": "application/json"} )
#API 定价
定价会随模型与区域更新,建议查看官方实时页面:
- 开发者 API:https://ai.google.dev/gemini-api/pricing↗
- Vertex AI:https://cloud.google.com/vertex-ai/pricing#gemini↗
一般策略:2.5 Flash 性价比最高(含多模态),2.5 Pro 用于复杂推理/长上下文,3.x 预览 适合评估新能力。
#下一步
提示:Gemini 更新频繁,关注 Google AI Blog↗ 获取最新动态。