logo

Code Interpreter Guide

现在更准确的官方叫法其实已经不是单独的 Code Interpreter,而是 Data analysis with ChatGPT,也常被用户继续叫作 Advanced Data Analysis。如果你还把它理解成一个旧 beta 功能,会低估它现在在文件分析、图表、Python 执行和可视化上的成熟度。

Code Interpreter analysis loop

它最适合什么任务

  • 清洗多份 Excel / CSV / PDF 数据
  • 快速做 exploratory analysis
  • 生成图表、summary table 和初步报告
  • 把重复数据处理逻辑先验证出来
  • 让 AI 先写可执行的 Python 分析脚本

它尤其适合“我知道要问什么,但不想自己手打数据处理代码”的场景。

按 OpenAI 当前帮助中心,这个能力现在已经支持:

  • interactive tables
  • interactive charts
  • up to 10 files in one conversation
  • up to 512 MB per file
  • bar / pie / scatter / line 等交互图表

这比最早大家印象里的“帮你跑点 Python”已经成熟很多。

正确理解它的能力边界

Code Interpreter 很强,但它不是“自动给出真相”的按钮。更准确地说,它会:

  1. 读取你上传的文件
  2. 在沙盒里写和运行 Python
  3. 输出图表、表格、文件或代码
  4. 根据你的追问继续修正分析

它擅长加速分析过程,不擅长替你承担业务判断和最终结论。

还有两个边界要特别记住:

  • 它不能直接从代码执行环境发外网请求
  • 代码执行环境是会话级隔离的,不是长期持久的 notebook

这两个点会直接影响你怎么设计分析流程。

一个更稳的使用流程

1. 先交代文件和目标

比起“分析一下这个文件”,更稳的是说清:

  • 文件是什么
  • 你最关心哪个 business question
  • 最终想要什么输出

例如:

These 8 CSV files are monthly sales exports.
Clean duplicate customers, merge them by customer_id,
find churn rate by region,
and give me a summary table plus a line chart.

2. 先做 cleaning,再做 insight

很多分析错误不是模型不会算,而是源数据本来就脏。更稳的顺序通常是:

  • 检查列名和数据类型
  • 处理缺失值和重复值
  • 确认 join key
  • 再开始算指标和画图

3. 要它暴露中间步骤

如果任务稍复杂,直接要求:

  • show assumptions
  • list cleaning steps
  • print intermediate table samples
  • explain formulas used

这样比只看最后一张图可靠得多。

常见高价值场景

财务和运营分析

  • 汇总多月报表
  • 找异常交易
  • 算 cohort、churn、conversion

招聘和人力数据

  • 解析候选人列表
  • 清洗 interview pipeline 数据
  • 汇总 hiring funnel 指标

内容和市场数据

  • 合并 campaign report
  • 对比不同渠道表现
  • 自动生成 summary table

文件处理与快速导出

OpenAI 当前帮助中心也明确把 file manipulation 和 file generation 算进它的实际能力范围。
所以它不只是“看表”,也能帮你:

  • 批量改表
  • 生成处理后的文件
  • 导出图表或结果文档

容易翻车的地方

第一轮结果看起来很像对的

这正是最危险的地方。你最好确认:

  • 公式有没有用对
  • 分组逻辑是否合理
  • join 是否造成重复计数

文件太大或结构太乱

这时不要硬让它一步做完。更稳的是先拆批处理,或先让它只做 schema review 和 sample analysis。

让它直接下业务结论

它能给你 pattern,但不能替你判断这个 pattern 在业务上意味着什么。

忘了看中间分析步骤

OpenAI 帮助中心现在一直强调可以点击 View Analysis 或复制代码。
这不是可有可无的附加功能,而是你检查分析是否靠谱的关键入口。

一个实用 prompt 模板

Role: You are a data analyst.
Files: I uploaded 6 monthly CSV exports.
Goal: Merge them, clean duplicates, and calculate churn by region.
Output: 1 summary table, 2 charts, and the Python steps used.
Constraint: Show intermediate checks before final conclusions.

官方资源

Code Interpreter 数据分析指南
AI Engineer

Code Interpreter 数据分析指南

ChatGPT Code Interpreter(高级数据分析)让你用自然语言处理 Excel/CSV,生成图表与分析报告。

Code Interpreter 数据分析指南Code Interpreter 简介

Code Interpreter Guide

现在更准确的官方叫法其实已经不是单独的 Code Interpreter,而是 Data analysis with ChatGPT,也常被用户继续叫作 Advanced Data Analysis。如果你还把它理解成一个旧 beta 功能,会低估它现在在文件分析、图表、Python 执行和可视化上的成熟度。

Code Interpreter analysis loop
Code Interpreter analysis loop

#它最适合什么任务

  • 清洗多份 Excel / CSV / PDF 数据
  • 快速做 exploratory analysis
  • 生成图表、summary table 和初步报告
  • 把重复数据处理逻辑先验证出来
  • 让 AI 先写可执行的 Python 分析脚本

它尤其适合“我知道要问什么,但不想自己手打数据处理代码”的场景。

按 OpenAI 当前帮助中心,这个能力现在已经支持:

  • interactive tables
  • interactive charts
  • up to 10 files in one conversation
  • up to 512 MB per file
  • bar / pie / scatter / line 等交互图表

这比最早大家印象里的“帮你跑点 Python”已经成熟很多。

#正确理解它的能力边界

Code Interpreter 很强,但它不是“自动给出真相”的按钮。更准确地说,它会:

  1. 读取你上传的文件
  2. 在沙盒里写和运行 Python
  3. 输出图表、表格、文件或代码
  4. 根据你的追问继续修正分析

它擅长加速分析过程,不擅长替你承担业务判断和最终结论。

还有两个边界要特别记住:

  • 它不能直接从代码执行环境发外网请求
  • 代码执行环境是会话级隔离的,不是长期持久的 notebook

这两个点会直接影响你怎么设计分析流程。

#一个更稳的使用流程

#1. 先交代文件和目标

比起“分析一下这个文件”,更稳的是说清:

  • 文件是什么
  • 你最关心哪个 business question
  • 最终想要什么输出

例如:

text
These 8 CSV files are monthly sales exports. Clean duplicate customers, merge them by customer_id, find churn rate by region, and give me a summary table plus a line chart.

#2. 先做 cleaning,再做 insight

很多分析错误不是模型不会算,而是源数据本来就脏。更稳的顺序通常是:

  • 检查列名和数据类型
  • 处理缺失值和重复值
  • 确认 join key
  • 再开始算指标和画图

#3. 要它暴露中间步骤

如果任务稍复杂,直接要求:

  • show assumptions
  • list cleaning steps
  • print intermediate table samples
  • explain formulas used

这样比只看最后一张图可靠得多。

#常见高价值场景

#财务和运营分析

  • 汇总多月报表
  • 找异常交易
  • 算 cohort、churn、conversion

#招聘和人力数据

  • 解析候选人列表
  • 清洗 interview pipeline 数据
  • 汇总 hiring funnel 指标

#内容和市场数据

  • 合并 campaign report
  • 对比不同渠道表现
  • 自动生成 summary table

#文件处理与快速导出

OpenAI 当前帮助中心也明确把 file manipulation 和 file generation 算进它的实际能力范围。
所以它不只是“看表”,也能帮你:

  • 批量改表
  • 生成处理后的文件
  • 导出图表或结果文档

#容易翻车的地方

#第一轮结果看起来很像对的

这正是最危险的地方。你最好确认:

  • 公式有没有用对
  • 分组逻辑是否合理
  • join 是否造成重复计数

#文件太大或结构太乱

这时不要硬让它一步做完。更稳的是先拆批处理,或先让它只做 schema review 和 sample analysis。

#让它直接下业务结论

它能给你 pattern,但不能替你判断这个 pattern 在业务上意味着什么。

#忘了看中间分析步骤

OpenAI 帮助中心现在一直强调可以点击 View Analysis 或复制代码。
这不是可有可无的附加功能,而是你检查分析是否靠谱的关键入口。

#一个实用 prompt 模板

text
Role: You are a data analyst. Files: I uploaded 6 monthly CSV exports. Goal: Merge them, clean duplicates, and calculate churn by region. Output: 1 summary table, 2 charts, and the Python steps used. Constraint: Show intermediate checks before final conclusions.

#官方资源

免费证书

最新免费认证与项目

快速补充简历亮点,提升竞争力。

查看免费证书 →

常见问题

Code Interpreter 需要付费吗?
是的,需要 ChatGPT Plus 订阅($20/月)才能使用。
支持哪些文件格式?
支持 Excel、CSV、JSON、PDF、图片等多种格式。