Phase 2: RAG 系统全栈开发 — AI Engineer Bootcamp

Week 4 · Embeddings + RAG from Scratch 直播 + 项目

4.1

Introduction to Embeddings

直播

📖 教学内容

什么是 Embedding — 文本 → 高维向量空间的映射

Embedding Models vs LLM Chat Models — 用途、API、成本、维度差异

向量相似度计算：Cosine Similarity、Euclidean Distance、Dot Product

主流 Embedding 模型对比：OpenAI text-embedding-3、Cohere embed、BGE

OpenAI Embeddings APINumPy

🔬 Lab 实操

1. 调用 Embedding API 将 100 段文本转为向量
2. 实现 Cosine Similarity 搜索 — 输入 query，返回最相关的 5 段文本
3. 可视化 Embedding 空间（用 t-SNE 降维）

对比不同 Embedding Model 的效果差异

🤖 搜索准确率自动评测

📋 作业

为 ISA 项目准备知识库：
1. 收集 50+ 相关文档
2. 文本切分（Chunking）实验
3. Embedding 并存储为本地向量库

👨‍🏫 Chunking 策略 Review

4.2

Introduction to RAG

直播

📖 教学内容

RAG 架构：Query → Retrieve → Augment → Generate

Naive RAG vs Advanced RAG：Pre-retrieval (query rewriting)、Retrieval (hybrid search)、Post-retrieval (re-ranking)

Vector Store 选型：Chroma、Pinecone、Weaviate、FAISS — 对比 hosted vs self-hosted

ChromaDBFAISS

🔬 Lab 实操

Project: Building RAG from Scratch in Python

纯 Python（无框架）实现完整 RAG 管线：
1. 文档加载 + Chunking
2. Embedding + 向量存储 (FAISS)
3. 相似度检索
4. Context 拼接 + LLM 生成

这是理解 RAG 原理最好的方式 — 不用框架，每一步自己写

👨‍🏫 代码 Review + 架构点评

📋 作业

在 RAG from Scratch 基础上，实现 3 个优化：
1. Query Rewriting — 重写用户问题提高检索质量
2. Re-ranking — 对检索结果重新排序
3. Citation — 答案中标注来源段落编号

提交代码 + 优化前后的对比评测

👨‍🏫 老师点评优化效果

📹 Week 4 自学内容

INFO

RAG Builder Toolbox

RAG 构建工具全景：Vector DB、Chunking 库、Embedding 服务

INFO

AI Resource Hub

AI 学习资源合集：论文、博客、开源项目

Week 5 · Production RAG + LangChain 直播 + 项目

5.1

Building Production-Ready RAG

直播

📖 教学内容

UI 构建：用 Streamlit / Gradio 快速搭建 RAG 前端

PDF Parsing 101：PyPDF2、pdfplumber、Unstructured — 表格和图片怎么处理

LLM Rate Limits：Token 限制、RPM/TPM 限流、指数退避重试、并发控制

API 成本管理：预算设置、cost tracking、model fallback 策略

Streamlitpdfplumbertiktoken

🔬 Lab 实操

Project: Production RAG Application

搭建支持 PDF 上传的 RAG 应用：
1. Streamlit UI — 文件上传 + 聊天界面
2. PDF 解析 + 自动 Chunking
3. Rate Limiting 中间件
4. Cost tracking dashboard

可分享给其他人使用的完整应用

👨‍🏫 项目 Demo + Review

📋 作业

P3 职业孵化器 Proposal：
每组选定一个 P3 项目方向
写 proposal：问题定义、技术选型、分工、时间线

P3 项目在 Demo Day 面向企业展示

👨‍🏫 Proposal 反馈

5.2

LangChain Core Constructs

直播

📖 教学内容

LangChain 核心概念：LLMs、Prompts、Chains、Memory、Retrievers

LCEL (LangChain Expression Language)：Chains 和 Runnables 的声明式组合

chain = prompt | llm | output_parser — Pipe 语法详解

Memory 实现：ConversationBufferMemory、ConversationSummaryMemory — 多轮对话

LangChainLCEL

🔬 Lab 实操

1. 用 LCEL 构建一个 3 步 Chain：分析问题 → 检索文档 → 生成答案
2. 添加 Memory — 实现多轮对话上下文保持
3. 自定义 Runnable — 添加日志和错误处理

🤖 Chain 运行验证

📋 作业

把 Week 4 的 RAG from Scratch 用 LangChain 重写
对比：代码量、可维护性、扩展性

形成"自建 vs 框架"的理解

👨‍🏫 对比分析 Review

5.3

Monitoring and Visibility with LangSmith

直播

📖 教学内容

LangSmith：Trace 每一次 LLM 调用 — Input/Output/Latency/Cost 全部可观测

Debugging：通过 Trace 定位 RAG 管线中的问题（检索失败 vs 生成偏差）

Dataset & Testing：用 LangSmith 构建测试集，跑回归测试

LangSmithLangChain

🔬 Lab 实操

1. 接入 LangSmith — 在 RAG 应用中添加 tracing
2. 分析 Trace — 找出 latency bottleneck
3. 构建 10 个测试用例，用 LangSmith Evaluate 跑评测

🤖 Tracing 接入验证

📋 作业

为 ISA 项目接入 LangSmith monitoring
提交：3 个有代表性的 Trace 截图 + 分析报告

👨‍🏫 老师点评

📹 Week 5 录播/自学

VIDEO

Introduction to LangChain

LangChain 设计哲学和模块总览

VIDEO

Budgeting and API Costs

LLM API 成本估算、预算控制、fallback 策略

VIDEO

LLMs Overview

主流 LLM 对比：GPT-4.1、Claude 4、Gemini 2.5、Llama 4、Mistral Large

INFO

End-to-End RAG Toolbox

完整 RAG 技术栈参考：Parser → Chunker → Embedder → Store → Retriever

Week 6 · GraphRAG + RAG 评估 + 综合项目直播 + 项目

6.1

GraphRAG + 混合检索

直播

📖 教学内容

为什么需要 GraphRAG — 纯向量检索的局限：无法捕捉实体关系、无法做多跳推理。比如问"张三的老板的老板是谁"，纯 Embedding 检索根本搞不定

Knowledge Graph 构建：从非结构化文本自动提取实体和关系，用 LLM 做 NER + Relation Extraction

GraphRAG 架构：Query → Graph Traversal + Vector Search → 融合排序 → LLM 生成

混合检索策略：Vector Search (语义) + BM25 (关键词) + Graph Traversal (关系) — 三路召回，用 RRF (Reciprocal Rank Fusion) 融合排序

工具选型：Neo4j / Nebula Graph（生产级图数据库） vs 纯 Python networkx（原型验证）

Neo4jLangChainnetworkx

🔬 Lab 实操

1. 用 LangChain + Neo4j 构建 GraphRAG pipeline — 文档 → 实体抽取 → 图存储 → 图检索
2. 对比纯向量 RAG vs GraphRAG 在多跳问题上的表现（准备 10 个多跳测试问题）
3. 实现混合检索：三路召回 + RRF 融合 — Vector + BM25 + Graph 结果合并排序

👨‍🏫 架构设计 Review

📋 作业

为 ISA 项目添加 GraphRAG 能力：
1. 对项目知识库做实体关系抽取，构建 Knowledge Graph
2. 实现 Graph + Vector 混合检索

提交：GraphRAG vs Vector RAG 对比评测报告 — 在多跳问题和单跳问题上分别跑 10 个 case

👨‍🏫 架构设计 Review

6.2

RAG Evaluation

直播

📖 教学内容

四大评估指标：
- Context Recall — 检索到了多少相关内容
- Context Precision — 检索结果中有多少是相关的
- Answer Relevancy — 答案和问题的相关性
- Faithfulness — 答案是否忠实于检索到的上下文

RAGAS Framework — 自动化 RAG 评估
Langfuse — 开源 LLM 可观测平台，和 LangSmith 互补

RAGASLangfuseLangSmith Eval

🔬 Lab 实操

1. 用 RAGAS 评估 Week 4-6 的 RAG 应用（包括 GraphRAG）
2. 接入 Langfuse — 对比 LangSmith vs Langfuse
3. 根据评估结果优化 RAG 管线（调 Chunking / Retrieval / Prompt）

🤖 RAGAS 分数自动评测

📋 作业

提交 RAG 评估报告：
- GraphRAG vs Naive RAG 的 4 个指标对比
- 每个优化步骤的 diff + 效果
- 最终 RAGAS 综合得分

👨‍🏫 评估报告 Review

6.3

Project: LangChain RAG QA Application

直播

📖 教学内容

综合 Phase 2 所有知识，用 LangChain 构建完整 RAG QA 系统：

架构：LangChain + ChromaDB/Neo4j + LangSmith + Streamlit
功能：多文档上传、GraphRAG 支持、对话式 QA、来源引用、历史记录
监控：LangSmith tracing + Langfuse metrics
评估：RAGAS 自动评测 + 人工抽检

LangChainChromaDBNeo4jStreamlitLangSmith

🔬 Lab 实操

Project: Building your First RAG QA Application with LangChain

从零到一完成完整应用：
1. 项目结构搭建
2. 文档 ingestion 管线（支持 Vector + Graph 双路索引）
3. Retrieval + Generation chain
4. Streamlit UI
5. Monitoring 接入
6. 评估 + 优化

👨‍🏫 项目 Demo Day

📋 作业

部署 RAG QA 应用到云端（Streamlit Cloud 或 AWS）

提交：
- GitHub 仓库链接
- 线上 Demo URL
- RAGAS 评测报告
- README 使用说明

👨‍🏫 部署验证 + Demo Review

📹 Week 6 录播/自学

VIDEO

用 AWS 构建 RAG 应用

AWS Bedrock + Lambda + S3 构建 Serverless RAG

INFO

RAG Evaluation Toolbox

RAG 评估工具全景：RAGAS、Langfuse、TruLens、DeepEval

INFO

GraphRAG 技术全景

GraphRAG vs RAPTOR vs HippoRAG — 三种图增强 RAG 方案的架构差异和适用场景

INFO

Deploying RAG in Production

RAG 生产部署：缓存、并发、监控、failover 策略