logo
Gemini 使用指南
Vibe Coding

Gemini 使用指南

Google Gemini 是 Google 最新的多模态 AI 模型,支持文本、图像、音频和视频理解。

Gemini 使用指南Gemini 简介

Gemini 简介(同步到 2025-12)

Gemini 是 Google 的多模态模型系列,最新已发布 Gemini 2.5 Pro / 2.5 Flash,并提供 Gemini 3 Pro/Flash 预览 与原生音频/视频/图片生成能力。官方模型清单与示例来自 Google AI for Developers

#为什么使用 Gemini?

#1. 原生多模态能力

Gemini 从设计之初就是多模态的:

  • 理解图片、PDF、视频
  • 分析音频内容
  • 文本生成和理解
  • 代码生成和解释

#2. 超长上下文

模型上下文长度(官方标称)
Gemini 2.5 Pro2M tokens
Gemini 2.5 Flash2M tokens(支持图像/视频输入)
Gemini 2.0 Flash1M+ tokens

2M tokens ≈ 150 万字 ≈ 2 小时视频

#最新模型速查(2025-12)

  • Gemini 2.5 Pro / 2.5 Flash:主力生产模型,2M 上下文,覆盖文本/图像/音频/视频,Flash 兼顾价格与延迟。
  • Gemini 3 Pro / 3 Flash(预览):新一代预览,适合评估迁移和能力对比。
  • 语音/流式gemini-2.5-flash-livegemini-2.5-flash-native-audio-preview-*
  • 图片生成gemini-2.5-flash-image-preview 支持生成图像。
  • 端侧:Gemini Nano 面向 Android / 设备端推理。

#3. 与 Google 生态集成

  • Google Workspace 集成
  • Google Cloud 原生支持
  • Android 深度集成

#Gemini 模型对比(2025-12)

模型特点适用场景
Gemini 3 Pro(预览)最新预览,强化推理与多模态尝鲜新特性、评估迁移
Gemini 3 Flash(预览)最新预览,低延迟即时交互、轻量应用
Gemini 2.5 Pro最强通用/多模态,2M tokens复杂推理、长文档/视频、代码
Gemini 2.5 Flash高性价比、也支持 2M tokens、图像/视频输入批量/实时多模态、产品内嵌
Gemini 2.0 Flash / Flash Lite成本更低的长上下文高并发/低成本场景
Gemini Nano端侧/移动设备内推理

#模型 ID 速查(API 参数)

用途推荐 model id备注
通用多模态推理gemini-2.5-pro长上下文,高质量输出
高性价比多模态gemini-2.5-flash2M ctx,图/音/视频输入
语音/流式gemini-2.5-flash-live低延迟语音/流式
TTS/音频输出gemini-2.5-pro-tts / gemini-2.5-flash-tts语音合成
图片生成gemini-2.5-flash-image-preview预览版
预览评估gemini-3-pro / gemini-3-flash新一代预览
低成本gemini-2.0-flash / gemini-2.0-flash-lite1M+ ctx

以上 ID 来自官方模型列表;可用性随区域/账户变化,发布/下线请查官方 deprecations。

#接入渠道

  • Google AI Studio:Playground + 生成 API Key,支持导出代码。
  • Gemini API(开发者 Key):适合前后端直接调用,请妥善保管 Key。
  • Vertex AI:企业级(VPC、私有服务接入、计费集中、数据驻留/合规)。
  • Workspace / Chrome / Android:面向消费或轻量协作的前端入口。

#使用方式

#1. Google AI Studio

访问 aistudio.google.com

  • 免费使用额度
  • 可视化测试界面
  • 直接获取 API Key

#2. Gemini App

访问 gemini.google.com

  • 免费基础版
  • Gemini Advanced ($20/月)
  • 移动端 App 支持

#3. API 调用

python
import google.generativeai as genai genai.configure(api_key="YOUR_API_KEY") model = genai.GenerativeModel("gemini-2.5-pro") response = model.generate_content("解释量子计算的核心原理,用 5 行总结") print(response.text)

#核心能力

#文本生成

python
model = genai.GenerativeModel("gemini-2.5-pro") response = model.generate_content(""" 分析以下代码的时间复杂度,并给出 O 表示、可能的优化建议: def fibonacci(n): if n <= 1: return n return fibonacci(n-1) + fibonacci(n-2) """)

#图像理解

python
import PIL.Image image = PIL.Image.open("diagram.png") response = model.generate_content([ "解释这张架构图", image ])

#视频分析

python
video_file = genai.upload_file("lecture.mp4") response = model.generate_content([ "总结这个视频的主要内容", video_file ])

#代码生成

Gemini 在代码任务上表现优秀:

  • 支持多种编程语言
  • 理解复杂代码逻辑
  • 生成文档和测试

#工具调用 / 结构化输出

python
tools = [ { "name": "get_weather", "description": "获取城市天气", "parameters": { "type": "object", "properties": {"city": {"type": "string"}}, "required": ["city"], }, } ] model = genai.GenerativeModel("gemini-2.5-flash") resp = model.generate_content( [{"text": "北京现在的天气如何?"}], tools=tools, generation_config={ "response_mime_type": "application/json", "max_output_tokens": 256, }, ) print(resp.candidates[0].content)

#Gemini vs 同类(简版参考)

特性Gemini 2.5 ProGPT-4.xClaude 4.5备注
上下文2M128K+200K2M 适合长文档/视频
多模态✅ 文/图/音/视频✅ 文/图/音✅ 文/图视频是 Gemini 优势
语音/流式✅ 原生音频/多模态流式Gemini 2.5 Flash/Live 支持
代码⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐长上下文代码分析 Gemini 有优势
价格参考官方定价--最新价格见官方页面

#Gemini Advanced(消费端)

$20/月 获得:

  • 直接使用 Gemini 2.5 Pro(面向消费者)
  • 2TB Google One 存储
  • Google Workspace 集成
  • 移动/网页端 App,优先体验新特性

#最佳实践

#1. 利用多模态

python
# 同时处理多种输入 response = model.generate_content([ "根据这张设计稿和需求文档,生成 React 组件代码", design_image, requirements_pdf ])

#2. 利用长上下文

python
# 一次性分析整个代码库 with open("codebase.txt") as f: code = f.read() # 可以很长! response = model.generate_content(f""" 分析以下代码库的架构,找出潜在的性能问题: {code} """)

#3. 结构化输出

python
response = model.generate_content( "列出 Python 的 10 个最佳实践", generation_config={"response_mime_type": "application/json"} )

#API 定价

定价会随模型与区域更新,建议查看官方实时页面:

一般策略:2.5 Flash 性价比最高(含多模态),2.5 Pro 用于复杂推理/长上下文,3.x 预览 适合评估新能力。

#下一步


提示:Gemini 更新频繁,关注 Google AI Blog 获取最新动态。

1v1免费职业咨询