Phase 2: RAG 系统全栈开发

Week 4-6 · 直播 + 项目 · 从 Embedding 到 GraphRAG
Week 4 · Embeddings + RAG from Scratch 直播 + 项目
4.1

Introduction to Embeddings

直播
📖 教学内容

什么是 Embedding — 文本 → 高维向量空间的映射

Embedding Models vs LLM Chat Models — 用途、API、成本、维度差异

向量相似度计算:Cosine Similarity、Euclidean Distance、Dot Product

主流 Embedding 模型对比:OpenAI text-embedding-3、Cohere embed、BGE

OpenAI Embeddings APINumPy
🔬 Lab 实操

1. 调用 Embedding API 将 100 段文本转为向量
2. 实现 Cosine Similarity 搜索 — 输入 query,返回最相关的 5 段文本
3. 可视化 Embedding 空间(用 t-SNE 降维)

对比不同 Embedding Model 的效果差异

🤖 搜索准确率自动评测
📋 作业

为 ISA 项目准备知识库:
1. 收集 50+ 相关文档
2. 文本切分(Chunking)实验
3. Embedding 并存储为本地向量库

👨‍🏫 Chunking 策略 Review
4.2

Introduction to RAG

直播
📖 教学内容

RAG 架构:Query → Retrieve → Augment → Generate

Naive RAG vs Advanced RAG:Pre-retrieval (query rewriting)、Retrieval (hybrid search)、Post-retrieval (re-ranking)

Vector Store 选型:Chroma、Pinecone、Weaviate、FAISS — 对比 hosted vs self-hosted

ChromaDBFAISS
🔬 Lab 实操

Project: Building RAG from Scratch in Python

纯 Python(无框架)实现完整 RAG 管线:
1. 文档加载 + Chunking
2. Embedding + 向量存储 (FAISS)
3. 相似度检索
4. Context 拼接 + LLM 生成

这是理解 RAG 原理最好的方式 — 不用框架,每一步自己写

👨‍🏫 代码 Review + 架构点评
📋 作业

在 RAG from Scratch 基础上,实现 3 个优化:
1. Query Rewriting — 重写用户问题提高检索质量
2. Re-ranking — 对检索结果重新排序
3. Citation — 答案中标注来源段落编号

提交代码 + 优化前后的对比评测

👨‍🏫 老师点评优化效果
📹 Week 4 自学内容
INFO
RAG Builder Toolbox
RAG 构建工具全景:Vector DB、Chunking 库、Embedding 服务
INFO
AI Resource Hub
AI 学习资源合集:论文、博客、开源项目
Week 5 · Production RAG + LangChain 直播 + 项目
5.1

Building Production-Ready RAG

直播
📖 教学内容

UI 构建:用 Streamlit / Gradio 快速搭建 RAG 前端

PDF Parsing 101:PyPDF2、pdfplumber、Unstructured — 表格和图片怎么处理

LLM Rate Limits:Token 限制、RPM/TPM 限流、指数退避重试、并发控制

API 成本管理:预算设置、cost tracking、model fallback 策略

Streamlitpdfplumbertiktoken
🔬 Lab 实操

Project: Production RAG Application

搭建支持 PDF 上传的 RAG 应用:
1. Streamlit UI — 文件上传 + 聊天界面
2. PDF 解析 + 自动 Chunking
3. Rate Limiting 中间件
4. Cost tracking dashboard

可分享给其他人使用的完整应用

👨‍🏫 项目 Demo + Review
📋 作业

P3 职业孵化器 Proposal:
每组选定一个 P3 项目方向
写 proposal:问题定义、技术选型、分工、时间线

P3 项目在 Demo Day 面向企业展示

👨‍🏫 Proposal 反馈
5.2

LangChain Core Constructs

直播
📖 教学内容

LangChain 核心概念:LLMs、Prompts、Chains、Memory、Retrievers

LCEL (LangChain Expression Language):Chains 和 Runnables 的声明式组合

chain = prompt | llm | output_parser — Pipe 语法详解

Memory 实现:ConversationBufferMemory、ConversationSummaryMemory — 多轮对话

LangChainLCEL
🔬 Lab 实操

1. 用 LCEL 构建一个 3 步 Chain:分析问题 → 检索文档 → 生成答案
2. 添加 Memory — 实现多轮对话上下文保持
3. 自定义 Runnable — 添加日志和错误处理

🤖 Chain 运行验证
📋 作业

把 Week 4 的 RAG from Scratch 用 LangChain 重写
对比:代码量、可维护性、扩展性

形成"自建 vs 框架"的理解

👨‍🏫 对比分析 Review
5.3

Monitoring and Visibility with LangSmith

直播
📖 教学内容

LangSmith:Trace 每一次 LLM 调用 — Input/Output/Latency/Cost 全部可观测

Debugging:通过 Trace 定位 RAG 管线中的问题(检索失败 vs 生成偏差)

Dataset & Testing:用 LangSmith 构建测试集,跑回归测试

LangSmithLangChain
🔬 Lab 实操

1. 接入 LangSmith — 在 RAG 应用中添加 tracing
2. 分析 Trace — 找出 latency bottleneck
3. 构建 10 个测试用例,用 LangSmith Evaluate 跑评测

🤖 Tracing 接入验证
📋 作业

为 ISA 项目接入 LangSmith monitoring
提交:3 个有代表性的 Trace 截图 + 分析报告

👨‍🏫 老师点评
📹 Week 5 录播/自学
VIDEO
Introduction to LangChain
LangChain 设计哲学和模块总览
VIDEO
Budgeting and API Costs
LLM API 成本估算、预算控制、fallback 策略
VIDEO
LLMs Overview
主流 LLM 对比:GPT-4.1、Claude 4、Gemini 2.5、Llama 4、Mistral Large
INFO
End-to-End RAG Toolbox
完整 RAG 技术栈参考:Parser → Chunker → Embedder → Store → Retriever
Week 6 · GraphRAG + RAG 评估 + 综合项目 直播 + 项目
6.1

GraphRAG + 混合检索

直播
📖 教学内容

为什么需要 GraphRAG — 纯向量检索的局限:无法捕捉实体关系、无法做多跳推理。比如问"张三的老板的老板是谁",纯 Embedding 检索根本搞不定

Knowledge Graph 构建:从非结构化文本自动提取实体和关系,用 LLM 做 NER + Relation Extraction

GraphRAG 架构:Query → Graph Traversal + Vector Search → 融合排序 → LLM 生成

混合检索策略:Vector Search (语义) + BM25 (关键词) + Graph Traversal (关系) — 三路召回,用 RRF (Reciprocal Rank Fusion) 融合排序

工具选型:Neo4j / Nebula Graph(生产级图数据库) vs 纯 Python networkx(原型验证)

Neo4jLangChainnetworkx
🔬 Lab 实操

1. 用 LangChain + Neo4j 构建 GraphRAG pipeline — 文档 → 实体抽取 → 图存储 → 图检索
2. 对比纯向量 RAG vs GraphRAG 在多跳问题上的表现(准备 10 个多跳测试问题)
3. 实现混合检索:三路召回 + RRF 融合 — Vector + BM25 + Graph 结果合并排序

👨‍🏫 架构设计 Review
📋 作业

为 ISA 项目添加 GraphRAG 能力:
1. 对项目知识库做实体关系抽取,构建 Knowledge Graph
2. 实现 Graph + Vector 混合检索

提交:GraphRAG vs Vector RAG 对比评测报告 — 在多跳问题和单跳问题上分别跑 10 个 case

👨‍🏫 架构设计 Review
6.2

RAG Evaluation

直播
📖 教学内容

四大评估指标
- Context Recall — 检索到了多少相关内容
- Context Precision — 检索结果中有多少是相关的
- Answer Relevancy — 答案和问题的相关性
- Faithfulness — 答案是否忠实于检索到的上下文

RAGAS Framework — 自动化 RAG 评估
Langfuse — 开源 LLM 可观测平台,和 LangSmith 互补

RAGASLangfuseLangSmith Eval
🔬 Lab 实操

1. 用 RAGAS 评估 Week 4-6 的 RAG 应用(包括 GraphRAG)
2. 接入 Langfuse — 对比 LangSmith vs Langfuse
3. 根据评估结果优化 RAG 管线(调 Chunking / Retrieval / Prompt)

🤖 RAGAS 分数自动评测
📋 作业

提交 RAG 评估报告:
- GraphRAG vs Naive RAG 的 4 个指标对比
- 每个优化步骤的 diff + 效果
- 最终 RAGAS 综合得分

👨‍🏫 评估报告 Review
6.3

Project: LangChain RAG QA Application

直播
📖 教学内容

综合 Phase 2 所有知识,用 LangChain 构建完整 RAG QA 系统:

架构:LangChain + ChromaDB/Neo4j + LangSmith + Streamlit
功能:多文档上传、GraphRAG 支持、对话式 QA、来源引用、历史记录
监控:LangSmith tracing + Langfuse metrics
评估:RAGAS 自动评测 + 人工抽检

LangChainChromaDBNeo4jStreamlitLangSmith
🔬 Lab 实操

Project: Building your First RAG QA Application with LangChain

从零到一完成完整应用:
1. 项目结构搭建
2. 文档 ingestion 管线(支持 Vector + Graph 双路索引)
3. Retrieval + Generation chain
4. Streamlit UI
5. Monitoring 接入
6. 评估 + 优化

👨‍🏫 项目 Demo Day
📋 作业

部署 RAG QA 应用到云端(Streamlit Cloud 或 AWS)

提交:
- GitHub 仓库链接
- 线上 Demo URL
- RAGAS 评测报告
- README 使用说明

👨‍🏫 部署验证 + Demo Review
📹 Week 6 录播/自学
VIDEO
用 AWS 构建 RAG 应用
AWS Bedrock + Lambda + S3 构建 Serverless RAG
INFO
RAG Evaluation Toolbox
RAG 评估工具全景:RAGAS、Langfuse、TruLens、DeepEval
INFO
GraphRAG 技术全景
GraphRAG vs RAPTOR vs HippoRAG — 三种图增强 RAG 方案的架构差异和适用场景
INFO
Deploying RAG in Production
RAG 生产部署:缓存、并发、监控、failover 策略