ChatGPT 5.1(GPT-5 系列)
最新 ChatGPT/GPT-5.1 能力与使用要点
TL;DR(中文)
- ChatGPT 5.1(GPT-5 系列)是 OpenAI 2025 主力模型,面向产品化(Responses API)和多模态(文本/图像/音频)。
- 与 GPT-4o/4.1 相比:推理深度可调、函数/JSON 输出更稳,长上下文与代码/表格理解更好。
- 典型组合:
ChatGPT 5.1做复杂规划/生成,GPT-4o-mini做批量/自动化,o1/o1-mini处理长链推理。
什么时候用
- 产品级问答/聊天(稳定格式输出、低幻觉)
- 代码/架构设计(结合工具调用与文件上下文)
- 多模态理解(截图/流程图/表格)与报告生成
- 系统 prompt 需要“可调推理深度/verbosity”的场景
Prompt & API 要点
- Responses API:设置
reasoning.effort(如medium/high)平衡质量与成本。 - 结构化输出:使用
tool_choice/response_format约束 JSON schema;必要时加简单self-check让模型验证字段。 - 长上下文:分段压缩或标题化后再拼接;需要可追溯时让模型输出“证据列表/来源”。
对比 & 选型
- 成本/延迟:5.1 > 4.1 > 4o,质量随之提升;批处理/自动化优先 4o-mini。
- 推理:链式思考或严谨规划可选
o1;与 5.1 组合时让 5.1 做草案、o1 做严谨检查。 - 多模态:截图/表格理解 5.1 ≈ 4.1,依旧强于 4o-mini。
常见坑
- 大 prompt 仍需节流:拆批、缓存检索结果;避免无意义上下文塞满窗口。
- 结构化输出失败:增加
temperature=0-0.3,并在 system 中写清“先验证再输出”。 - 工具调用循环:给函数调用加“最多 N 轮”与失败兜底响应。