Code Interpreter Guide
现在更准确的官方叫法其实已经不是单独的 Code Interpreter,而是 Data analysis with ChatGPT,也常被用户继续叫作 Advanced Data Analysis。如果你还把它理解成一个旧 beta 功能,会低估它现在在文件分析、图表、Python 执行和可视化上的成熟度。
它最适合什么任务
- 清洗多份 Excel / CSV / PDF 数据
- 快速做 exploratory analysis
- 生成图表、summary table 和初步报告
- 把重复数据处理逻辑先验证出来
- 让 AI 先写可执行的 Python 分析脚本
它尤其适合“我知道要问什么,但不想自己手打数据处理代码”的场景。
按 OpenAI 当前帮助中心,这个能力现在已经支持:
- interactive tables
- interactive charts
- up to 10 files in one conversation
- up to 512 MB per file
- bar / pie / scatter / line 等交互图表
这比最早大家印象里的“帮你跑点 Python”已经成熟很多。
正确理解它的能力边界
Code Interpreter 很强,但它不是“自动给出真相”的按钮。更准确地说,它会:
- 读取你上传的文件
- 在沙盒里写和运行 Python
- 输出图表、表格、文件或代码
- 根据你的追问继续修正分析
它擅长加速分析过程,不擅长替你承担业务判断和最终结论。
还有两个边界要特别记住:
- 它不能直接从代码执行环境发外网请求
- 代码执行环境是会话级隔离的,不是长期持久的 notebook
这两个点会直接影响你怎么设计分析流程。
一个更稳的使用流程
1. 先交代文件和目标
比起“分析一下这个文件”,更稳的是说清:
- 文件是什么
- 你最关心哪个 business question
- 最终想要什么输出
例如:
These 8 CSV files are monthly sales exports.
Clean duplicate customers, merge them by customer_id,
find churn rate by region,
and give me a summary table plus a line chart.
2. 先做 cleaning,再做 insight
很多分析错误不是模型不会算,而是源数据本来就脏。更稳的顺序通常是:
- 检查列名和数据类型
- 处理缺失值和重复值
- 确认 join key
- 再开始算指标和画图
3. 要它暴露中间步骤
如果任务稍复杂,直接要求:
- show assumptions
- list cleaning steps
- print intermediate table samples
- explain formulas used
这样比只看最后一张图可靠得多。
常见高价值场景
财务和运营分析
- 汇总多月报表
- 找异常交易
- 算 cohort、churn、conversion
招聘和人力数据
- 解析候选人列表
- 清洗 interview pipeline 数据
- 汇总 hiring funnel 指标
内容和市场数据
- 合并 campaign report
- 对比不同渠道表现
- 自动生成 summary table
文件处理与快速导出
OpenAI 当前帮助中心也明确把 file manipulation 和 file generation 算进它的实际能力范围。
所以它不只是“看表”,也能帮你:
- 批量改表
- 生成处理后的文件
- 导出图表或结果文档
容易翻车的地方
第一轮结果看起来很像对的
这正是最危险的地方。你最好确认:
- 公式有没有用对
- 分组逻辑是否合理
- join 是否造成重复计数
文件太大或结构太乱
这时不要硬让它一步做完。更稳的是先拆批处理,或先让它只做 schema review 和 sample analysis。
让它直接下业务结论
它能给你 pattern,但不能替你判断这个 pattern 在业务上意味着什么。
忘了看中间分析步骤
OpenAI 帮助中心现在一直强调可以点击 View Analysis 或复制代码。
这不是可有可无的附加功能,而是你检查分析是否靠谱的关键入口。
一个实用 prompt 模板
Role: You are a data analyst.
Files: I uploaded 6 monthly CSV exports.
Goal: Merge them, clean duplicates, and calculate churn by region.
Output: 1 summary table, 2 charts, and the Python steps used.
Constraint: Show intermediate checks before final conclusions.
Related pages
官方资源
- Data analysis with ChatGPT:https://help.openai.com/en/articles/8437071-code-interpreter
- ChatGPT release notes(data analysis updates):https://help.openai.com/en/articles/6825453-chatgpt-code-interpreter-beta-