研究工作的核心痛点不是找不到论文,而是找到了 40 篇,全部放着吃灰,因为读完一篇已经忘了上一篇说什么。NotebookLM 解决的恰恰是这个问题——它把你上传的文件变成一个可以对话的知识库,回答只从你的来源里提取,不会凭空捏造引用。
这章讲的是一套可以实际跑通的流程:上传论文 → 拆解要点 → 做笔记 → 准备综述草稿。

第一步:按项目建 Notebook,不要全扔一个本子里
NotebookLM 的 notebook 是隔离的——不同 notebook 之间不共享上下文。这不是 bug,是设计:它防止不相关的资料互相干扰答案质量。利用这个特性的方法是按研究项目建 notebook,而不是按学科建。
好的分法:
毕业论文第二章 — 机器学习模型比较Literature Review — NLP in Healthcare 2020-2024会议投稿备料 — ACL 2025 相关论文
差的分法:
所有 AI 论文(上传 50 篇不同主题的 PDF,答案质量迅速崩塌)研究资料(什么都往里扔)
source 数量限制:
| 计划 | 每本 notebook 上限 | |------|------------------| | Free | 50 个 source | | Plus | 300 个 source | | Ultra | 600 个 source |
每个 source 的上限是 500,000 词或 200MB(两者先到先限)。对于标准学术 PDF,一篇 40 页论文大概 10,000–15,000 词,50 个 source 能放 30-50 篇论文,Free 计划做一个专题的文献综述完全够。
实操建议:同一个大研究项目,按章节或子主题分成 2-3 个 notebook,比一个 notebook 塞满效果要好。Gemini 处理聚焦来源时比处理杂乱大量来源的回答质量高出明显。
第二步:上传论文,来源质量决定答案质量
NotebookLM 支持的来源类型:PDF、Google Docs、网页 URL、YouTube 视频链接、音频文件、纯文本。学术场景用得最多的是 PDF 和 URL。
影响效果的关键:PDF 的文字是否可提取。
✅ 效果好的来源:
- 文字 PDF(直接从 Word / LaTeX 导出的)
- Google Scholar 下载的论文 PDF(绝大多数是文字型)
- arXiv PDF(LaTeX 编译,文字清晰)
- 期刊官网直接下载的 PDF
❌ 效果差的来源:
- 扫描件 PDF(OCR 识别后的图片文件)
- 截图拼成的 PDF
- 含大量公式图表但无文字图层的 PDF
判断方法:在 PDF 阅读器里尝试选中文字,能选中就是文字型,不能选中(或选中是乱码)就是图片型。图片型 PDF 上传后 NotebookLM 基本无法有效提取内容。
批量上传时,把所有 PDF 放在同一个 Google Drive 文件夹,然后在 NotebookLM 里选「Google Drive」批量导入,比一个个拖进来省时间。
第三步:Chat 提问,系统提取每篇论文的核心
上传完成后,最低效的用法是直接问「这些论文说了什么」——这种问题得到的是泛泛总结,信息密度低。高效的做法是用结构化问题逐层拆解。
快速了解一篇新论文
这篇论文的研究问题是什么?
使用了什么研究方法(数据集/实验设计/模型架构)?
主要发现是什么,关键数字/指标是多少?
作者提到了哪些局限性?一次问 4 个问题,NotebookLM 会分别回答并标注来自哪篇文档的哪段。这比逐句读论文快 5-10 倍,关键数据都有原文佐证,不是 AI 编的。
跨多篇论文对比
这 N 篇论文在 [某个具体问题] 上的结论一致还是矛盾?
哪些论文使用了相似的方法?它们的结果有什么差异?
在 [某个指标] 上,各论文报告的数值范围是多少?上传同一领域的 5-10 篇论文,用这类问题快速梳理学术争论的现状,比自己逐篇读再对比快得多。
找研究缺口
这些文献中,哪些问题被反复提到但没有被充分解决?
多篇论文共同承认的 limitation 有哪些?
在 [某个研究方向] 上,作者们建议的未来工作是什么?这是写 Literature Review 的 gap 分析时非常有用的问法。
一个完整的逐篇处理模板
[论文标题/缩写]:
1. 核心研究问题:
2. 方法:
3. 主要发现(含具体数字):
4. 与[你的研究主题]的相关性:
5. 可引用的关键句:在 Chat 里按这个模板问,然后把 NotebookLM 的回答 pin 到 Notes 里,逐篇处理完就有了一份结构化的论文笔记库。
第四步:Notes——把有用的回答留住
NotebookLM 的 Notes 面板是它最低调但最实用的功能之一。每次 Chat 得到一个有价值的回答,点回答旁边的「Save to Note」(或 pin 图标),这条内容就存进了 Notes,不会随着对话刷新丢失。
Notes 本身也可以作为 source——把你自己整理的研究框架、初步结论、待核实的问题写成 Note,上传进来,然后让 NotebookLM 基于这份 Note 加上原始论文来回答问题。这实现了「用你的框架 + AI 从文献里找支持」的组合。
导出到 Google Docs(2025 年 12 月上线)
Notes 面板里,点任意 Note 右上角的三点菜单,选「Export to Google Docs」,直接导出带格式的内容。可以导出的内容类型:
- 单条 Note
- Briefing Doc(摘要报告)
- Study Guide(章节 + 重点问答)
- Blog Post(适合改写成综述段落的初稿)
导出到 Google Docs 之后就能进入正常的写作流程——在 Docs 里补充、改写、加引用格式,不用在 NotebookLM 里拼凑文字。
第五步:生成综述草稿框架
上传完所有论文、建立好 Notes 之后,可以利用 NotebookLM 的几个内置输出功能快速产出综述草稿的骨架:
Briefing Doc:点右侧 Studio 面板的「Briefing Doc」,NotebookLM 自动生成一份覆盖所有来源的摘要文档,按主题分段,每段标注来源。这不是综述,但是一份非常好用的提纲参考——它帮你看清楚你手头的资料覆盖了哪些议题、哪些是重复的、哪些是孤证。
Deep Research 模式(2025 年底上线):在 Chat 里开启 Deep Research,它会自动扩展搜索——除了你上传的文献,还会在网上查找相关资源,生成一份有引用来源的综合报告。适合在你已有的文献基础上快速摸清一个子领域的全貌。
实际用法建议:把 Briefing Doc 的结构作为综述的初始提纲,然后用 Chat 针对每个小节逐一问「这个主题下各来源的具体论据是什么」,把得到的内容整理成段落,导出到 Google Docs,再人工润色和补充引用格式。
NotebookLM 在学术场景的真实局限
用之前要清楚几件事,避免踩坑:
没有引用管理:NotebookLM 会在回答里标注「来自 [论文名]」,但不生成标准引用格式(APA / MLA / Chicago)。你仍然需要 Zotero、EndNote 或手动管理 references list。NotebookLM 不替代文献管理工具。
不能搜索数据库:它只能读你上传的内容,不能联网搜索 Google Scholar、PubMed 或 Semantic Scholar。发现新文献还得靠别的工具,NotebookLM 处理的是「已找到的文献」。
citations 没有页码:NotebookLM 引用到句子级别,但不告诉你是第几页。用它生成的原句去原文里 Ctrl+F 搜索,或者在 Chat 里追问「这句话在哪一段」,能定位到大概位置,但不能直接用于正式引用。
不同 notebook 不互通:如果你的研究课题跨越两个 notebook 的资料,必须手动在两边分别问,没有跨本汇总的功能。
自由文字 note 不算来源:你在 Notes 里手写的笔记如果没有上传为 source,Chat 不会"知道"这些内容——只有加到 Sources 里的才算进上下文。
完整工作流总结
阶段 1:建库(1-2 小时,一次性)
→ 新建 notebook(按研究子主题命名)
→ 批量上传文字型 PDF
→ 确认每篇 source 上传成功,内容可提取阶段 2:提取(每篇论文 5-10 分钟)
→ 结构化 4 问:研究问题 / 方法 / 发现 / 局限
→ Save to Note 保留有价值的回答
→ 重复直到所有论文处理完
阶段 3:综合(2-4 小时)
→ 生成 Briefing Doc 作为主题地图
→ 跨论文对比提问(一致性 / 矛盾 / gap)
→ Notes 里整理研究缺口和可用论据
阶段 4:起草(导出后在 Docs 完成)
→ 按 Briefing Doc 提纲 Export to Google Docs
→ 在 Docs 里人工补充引用格式(Zotero)
→ 回到 NotebookLM 补充某段需要的具体论据
这套流程的核心价值不是让 AI 替你写综述,而是把「读了 40 篇但什么都记不住」变成「有一个随时可以查的结构化笔记库」。综述写作的瓶颈从来不是写,是整理——NotebookLM 的价值就在整理这段。