logo
视频课程课程安排

AI Engineer 进阶:从 RAG 到 Agent 与模型调优

    课程视觉
    bootcamp-visual
    Class Schedule

    课程大纲

    分阶段课程安排,方便在职或跨时区同学灵活学习

    🎬 VideoIntroduction to LangChain
    ℹ️ InformationProduction RAG Toolbox
    学习目标  - 掌握如何使用Production RAG Toolbox构建和优化面向生产环境的Retrieval Augmented Generation (RAG) 系统  - 理解RAG系统的核心组件在生产环境中的应用与最佳实践  - 学习如何... 登录后查看完整内容
    🎬 VideoLangChain Core Constructs
    🎬 VideoLangChain 架构层次
    🎬 VideoChat Models-深入
    本节课学习目标以工程视角理解 Chat Models 在真实 AI 应用中的使用方式搭建清晰的 Chat Message 结构,为后续 RAG、Function Calling、Agent 奠定基础明确模型参数与输出行为之间的关系,避免“黑盒式调用”核心知识点讲解1. Chat ... 登录后查看完整内容
    🎬 VideoPrompt Templates-高级技巧
    本节课学习目标将零散的 Prompt 编写方式系统化,转化为可复用、可维护的模板设计支持复杂业务场景下的动态输入、多轮上下文与稳定输出为后续 RAG、Agent、自动化流程中的 Prompt 管理打基础核心知识点讲解1. Prompt Template 的基本结构模板化 Prom... 登录后查看完整内容
    🎬 VideoOutput Parsers-实战
    本节课围绕 如何将大模型输出从“不稳定的自然语言”转化为“可直接被程序使用的结构化结果” 展开,重点讲解多种 Output Parser 在真实 AI 工程中的使用方式与适用场景。1. 大模型输出不确定性的问题大模型默认输出为自由文本,格式不稳定不同 prompt、tempera... 登录后查看完整内容
    🎬 VideoRetrieval-向量存储
    本节课程内容概述向量存储在 RAG 系统中的角色与位置文档如何从原始文本转化为可检索的向量表示(Embedding → Vector Store)向量存储与传统数据库 / 搜索引擎的核心差异基于语义相似度的检索流程(Query → Embedding → 相似度搜索)主流向量数据... 登录后查看完整内容
    🎬 VideoDocument loaders
    本节课内容概述(Document Loaders & Text Splitters)不同数据来源在 RAG 系统中的角色与差异:本地文本文件、结构化文档、网页内容、数据库数据常见 Document Loader 类型与适用场景:文本类:TextLoader、CSVLoad... 登录后查看完整内容
    🎬 VideoLangchain Expressio Nlanguage LCEL
    本节课程系统讲解 LangChain 中 LCEL(LangChain Expression Language) 的核心设计思想与实战用法,带你从「单一 Prompt + Model」逐步构建可组合、可调试、可扩展、可上线的 AI 应用链路。课程重点不在“写 Prompt”,而在... 登录后查看完整内容
    🎬 VideoLangsmith
    本节课程围绕 LangSmith 在真实 AI 工程中的落地使用展开,系统讲解如何通过 LangSmith 对基于 LangChain 的 LLM 应用进行全链路追踪、调试、评估与生产监控。课程从 LangSmith 的核心价值与使用场景入手,带你理解 Trace / Run 的... 登录后查看完整内容
    🎬 VideoCode Examples
    课程以 LCEL(LangChain Expression Language)为核心,逐步演示 Prompt Template、Output Parser、RAG、并行执行与多链组合等关键能力,帮助学员真正理解 “链是如何被一步步拼出来的”,并掌握将零散能力组合成可复用 AI W... 登录后查看完整内容
    🎬 VideoAgents & Tools
    本节课程将聚焦 Agent 与 Tool 的实际工程用法,带你从“单纯调用 LLM”升级到“让模型会用工具、能自主决策”的 Agent 系统。课程通过 LangChain 的 @tool 机制与 ReAct Agent 实例,演示如何为大模型定义可调用的外部工具(如计算、搜索),... 登录后查看完整内容
    🎬 VideoMemory 系统
    本节课程围绕 LangChain Core Constructs 中的 Memory 模块 展开,系统讲解 Memory 在 LangChain 链式调用中的设计理念与基础用法。课程将从「为什么 LLM 默认是无状态的」这一核心问题出发,结合 ConversationBuffer... 登录后查看完整内容
    🎬 VideoLangChain与外部数据源的集成
    本节课程系统讲解为什么仅依赖大模型自身知识无法满足真实业务需求,以及 LangChain 如何通过标准化的 Chain、Runnable 和 Tool 机制,将数据库和外部 API 等数据源引入到大模型推理流程中,构建具备实时性和业务上下文的 AI 应用。本节课程目标理解大模型在... 登录后查看完整内容
    🎬 VideoSQL 数据库集成
    这节课程将讲解 LangChain 如何将结构化业务数据接入到大模型推理流程中。通过标准化的 SQLDatabase 与 SQLDatabaseChain 组件,演示如何让 LLM 在不直接编写 SQL 的情况下,安全、可控地查询数据库,并将查询结果作为上下文参与模型生成,为企业... 登录后查看完整内容
    🎬 VideoREST API集成
    讲解如何将外部 Web API 封装为 LangChain 可调用的工具(Tool),并通过 Agent 调度实现模型与实时外部服务的协同工作,使 LLM 能够在推理过程中主动获取最新、动态的数据。本节课程目标理解为什么 REST API 是 LLM 系统中最常见的外部数据来源掌... 登录后查看完整内容
    🎬 VideoMonitoring and Visibility with LangSmith
    本节课程聚焦 LangSmith 在生成式 AI 应用中的监控与可观测性能力,系统讲解如何对基于 LangChain 的 LLM 应用进行运行追踪、日志记录、性能分析与结果评估。通过 LangSmith,开发者可以清晰地看到每一次模型调用、链路执行与工具使用的真实运行情况,从而将... 登录后查看完整内容
    🎬 VideoLLMs Overview
    这节课会从工程与系统视角出发,系统梳理大语言模型(LLMs)能力边界与演进路径的理论课程。本节课将帮助学员理解:LLM 能解决什么问题、为什么会出现幻觉、以及在真实生产环境中为何需要 RAG(Retrieval-Augmented Generation)等增强方案。这节课课程由 ... 登录后查看完整内容
    🧪 LabProject:Building and Sharing your First RAG QA Application with LangChain
    学习目标- 掌握如何使用LangChain从零构建一个Retrieval Augmented Generation (RAG) 问答 (QA) 应用- 理解RAG系统的核心构件及其在知识问答中的应用- 学习如何将文档检索与生成模型相结合,以实现高效的问答功能- 学会如何分享和部署... 登录后查看完整内容
    🎬 VideoRAG Review
    🎬 VideoTraditional Retrieval Evaluation Metrics
    本节课围绕 RAG(Retrieval-Augmented Generation)系统的评估方法展开,系统性回顾 RAG 的完整流程,并重点讲解在真实 AI 工程场景中,如何通过科学的 Evaluation 指标判断一个 RAG 系统“是否真的好用”。课程从传统信息检索指标出发,... 登录后查看完整内容
    🎬 VideoLLM Generation Evaluation Metrics
    本节课系统讲解大语言模型(LLM)生成结果的评估方法,帮助学员从“模型能不能跑”进阶到“模型生成得好不好、是否可靠、是否可上线”。课程围绕文本质量、内容准确性与相关性,以及安全与合规三大维度,建立一套工程上可落地的 LLM 生成评估思路,为后续 RAG 系统评估与生产级 AI 应... 登录后查看完整内容
    🎬 VideoRAG Evaluation1
    本节课聚焦于RAG(Retrieval-Augmented Generation)系统的评估策略,帮助学员从整体视角理解“一个 RAG 系统好不好”应该如何判断。课程不局限于单一指标,而是系统梳理当前业界常用的几类 RAG 评估方法,包括人工评估、传统指标评估、LLM-as-Ju... 登录后查看完整内容
    🎬 VideoRAG Evaluation Frameworks
    本节课聚焦 RAG 系统的系统化评估方法,从“为什么仅靠效果演示不够”出发,系统介绍当前业界主流的 RAG Evaluation Frameworks,重点讲解 TruLens 与 RAGAS 两套工具的设计理念、评估维度与适用场景。通过本节内容,学员将理解如何从 Query、C... 登录后查看完整内容
    🎬 VideoRAGAS evaluation Metrics
    本节课将系统讲解 RAGAS(Retrieval-Augmented Generation Assessment System) 在 RAG 系统评估中的核心思想与实战用法,帮助学员从“能跑的 RAG”进阶到“可量化、可优化的 RAG”。课程将围绕 RAGAS 的整体评估框架、核... 登录后查看完整内容
    🎬 VideoMetrics: Context Recall, Context Precision, Answer Relevancy, and Faithfulness
    学习目标- 掌握Metrics中的核心概念,包括Context Recall、Context Precision、Answer Relevancy和Faithfulness- 理解这些指标在评估生成式AI和Retrieval Augmented Generation (RAG)系... 登录后查看完整内容
    🎬 VideoRAGAS代码实操
    本节课是 RAGAS Evaluation Metrics 的配套实操课程,重点不再停留在“指标概念”,而是完整跑通一套 RAGAS 的代码级评估流程,理解 RAGAS 在真实 AI 工程中的使用方式。课程核心内容1. 环境与项目结构初始化讲解如何配置 RAGAS 实验环境,包括... 登录后查看完整内容
    🎬 VideoLangfuse
    本节课系统介绍了 Langfuse 作为开源 LLM Engineering 平台,如何在真实生产环境中帮助 AI Engineer 对 LLM / RAG / Agent 应用进行全链路可观测、评估、调试与持续优化。课程从 Generative AI 的工程化生命周期出发,覆盖... 登录后查看完整内容
    🎬 VideoRAG Asessment (RAGAS) Framework 2
    RAGAS 框架核心指标拆解理解 RAGAS 如何从多个维度评估一个 RAG 系统:Answer Correctness:答案是否正确、有无幻觉Answer Relevancy:回答是否真正回应了用户问题Context Precision:检索到的内容是否“用得上”Context... 登录后查看完整内容
    ℹ️ InformationRAG Evaluation Toolbox
    学习目标  - 掌握如何使用RAG Evaluation Toolbox评估Retrieval Augmented Generation (RAG)系统的性能  - 学习如何设计和应用关键评估指标来衡量RAG系统的检索和生成质量  - 理解如何通过R... 登录后查看完整内容
    🎬 VideoAgents
    介绍什么是 AI Agent,以及它与普通 LLM 的区别讲清 AI Agent 的核心组成:目标、工具、记忆、规划与行动梳理 AI Agent 的基本工作流程(目标 → 信息 → 执行 → 反馈)理解 Agent 如何从“回答问题”升级为“自主完成任务”为后续 Multi-Ag... 登录后查看完整内容
    🎬 VideoThe Reasoning-Action (ReAct) Framework
    介绍 ReAct(Reasoning-Action)框架 在 AI Agent 构建中的核心思想与工程实现方式。通过将「思考(Reasoning)」与「行动(Action)」显式结合,ReAct 让大模型在解决复杂问题时,能够边推理、边调用工具、边修正路径,从而显著提升 Agen... 登录后查看完整内容
    🎬 VideoSearch and Retrieval with Tools (Function Calling)
    课程围绕 Function Calling 在搜索与信息检索场景中的实际应用 展开,系统讲解如何让 LLM 从“只能生成文本”,升级为“可以主动调用工具、访问外部数据、完成复杂任务的智能 Agent”。课程通过 Search / Retrieval 场景,结合 ReAct 思想与... 登录后查看完整内容
    ℹ️ InformationProduction Agents Application Toolbox
    学习目标通过本课程的学习,学员将能够:掌握智能Agent系统的基本原理与架构设计。学习多智能体(Multi-Agent)协同工作的方法和策略,实现Agent间的无缝协作。了解如何在生产环境中优化智能Agent系统的性能和效率,以处理大规模并发任务。掌握监控与自动化调试的技术,确保... 登录后查看完整内容
    🎬 VideoMulti-Agent Systems
    MAS 基本概念:介绍什么是多智能体系统(Multi-Agent Systems),以及多个具备自主决策能力的 Agent 如何协同或竞争以完成复杂目标。核心运行机制:理解 Agent 之间的协作、协调与分工模式,以及它们在系统中各自承担的角色。复杂问题解决能力:说明 MAS 在... 登录后查看完整内容
    🎬 VideoNetwork of Agents
    架构理念:介绍 Network of Agents 多智能体架构,多个 Agent 独立运行、相互通信、协作完成复杂任务。协作方式:Agent 之间通过任务路由与信息交换实现去中心化协作,而非单一控制节点。优势认知:强调该模式在探索性问题、研究型任务中具备灵活性与并行能力。核心挑... 登录后查看完整内容
    🎬 VideoSupervisor Agent Approach
    介绍 Supervisor Agent 架构的基本概念:由一个中心 Supervisor 统一管理多个子 Agent讲解 Supervisor 在多 Agent 系统中的核心职责:任务拆分、路由分发与结果汇总理解子 Agent 的角色定位:专注单一能力或领域,只负责执行,不做全局... 登录后查看完整内容
    🎬 VideoHierarchical Supervisor Systems
    什么是分层 Supervisor 多智能体架构分层结构如何工作(Top → Mid → Sub Agents)任务在层级中的流转方式分层监督系统中的通信机制这种架构解决了哪些实际问题适合使用 Hierarchical Supervisor Systems 的场景
    🎬 VideoCommunication Mechanisms in Multi-Agent Systems
    1. 为什么通信机制决定了多 Agent 系统的上限2. Shared State Communication(共享状态通信)3. Tool Call-Based Communication(基于工具调用的通信)4. Mixed Communication States(混合通信... 登录后查看完整内容
    🎬 VideoWhat is LangSmith
    把 LLM 应用当成工程系统而不是黑盒模型 来对待让 Prompt、Agent、Tool 调用变得 可见、可评估、可复盘为后续复杂 Agent、MCP、多工具系统提供工程级基础设施支持
    🎬 VideoAgent Demo展示
    本节课通过一个完整的 Agent Demo,串联起从 任务设计 → Agent 编排 → 工具调用 → 运行与观测 的全过程,重点理解 “Agent 是如何真正跑起来的”。1. Agent 的真实工作方式:从 Prompt 到 Task将“一个想法”拆解为 明确、可执行的 Tas... 登录后查看完整内容
    🎬 VideoHierarchical, Multi-Agent Collaboration, Agent Supervision
    🎬 VideoMulti-Agent Frameworks: AutoGen, CrewAI
    学习目标- 理解Multi-Agent Frameworks的核心概念,并学习如何使用AutoGen和CrewA构建多Agent系统- 掌握如何通过这些框架设计、部署和管理多个Agents,处理复杂任务- 学习如何优化Agents之间的协作与通信,提升系统的任务执行效率- 探索如... 登录后查看完整内容
    🧪 LabProject:Building a Multi-Agent RAG Application with LangGraph
    学习目标- 掌握如何使用LangGraph构建一个多Agent的Retrieval Augmented Generation (RAG)应用- 理解如何通过多Agent架构实现任务分工、信息检索与生成的自动化协作- 学习如何优化多Agent系统的通信与任务调度,提升RAG应用的执... 登录后查看完整内容
    ℹ️ InformationMulti-Agent Application Toolbox
    学习目标  - 掌握使用Multi-Agent Application Toolbox构建和管理多Agent系统的核心技能  - 理解如何通过工具箱中的组件实现多Agent任务分工、协作与通信优化  - 学习如何利用Multi-Agent Appli... 登录后查看完整内容
    🎬 VideoIntroducing the Model Context Protocol(MCP)
    注册API Keys、Introducing the Model Context Protocol(MCP)为什么需要 MCP:从 M×N 集成混乱说起拆解大模型在真实工程中的核心缺陷:无法访问实时数据、环境上下文、私有与企业信息解释传统 Function Calling / A... 登录后查看完整内容
    🎬 VideoMCP Server
    MCP Server 在整个 AI 工程体系中的真实位置AI Agent 如何“合法、安全、可扩展”地调用真实世界工具独立实现一个可被 LLM 使用的 MCP Server为后续 多 Agent、复杂工具编排、企业级 AI 系统 打下架构基础MCP 要解决的核心问题:M×N 集成... 登录后查看完整内容
    🎬 Video解读原码
    从源码视角理解 MCP 整体架构 拆解 MCP Host、Client、Server 的真实职责分工,理解它们在代码中的入口、调用关系,以及如何协同完成一次完整的工具调用流程。深入 STDIO Transport 的底层通信机制 结合 Node.js / TypeScript 源... 登录后查看完整内容
    🎬 VideoIntegrating MCP (Mixture of Content Providers) into AI Engineering
    本节课内容要点MCP(Model Context Protocol / Mixture of Content Providers)的整体架构与设计目标Function Calling 在 MCP 中的角色:从模型意图识别到工具执行的完整链路MCP Host / Client / ... 登录后查看完整内容
    🎬 VideoBuilding a MCP Project 01
    Deep Agent / MCP 的整体架构认知 解释什么是 Deep Agent,以及为什么需要从“单轮对话模型”升级为“可规划、可执行、可追踪的智能体系统”。基于 LangGraph 的 Agent Graph 设计 通过 graph.ts 和 createReactAgen... 登录后查看完整内容
    🎬 VideoBuilding a MCP Project 02
    Deep Agents 与多智能体系统设计本节课将带你从「单一 LLM 调用」正式升级到 AI Agent Engineering 的核心能力,系统性讲解 Deep Agents(深度代理)与多智能体架构 的真实工程实现方式。你将学习如何将大模型构建为一个 可规划、可拆解任务、可... 登录后查看完整内容
    🎬 VideoDeep agents 01
    1. 课程简介本课程旨在深入解析下一代 AI Agent——“深度代理”的运作机制。课程将从深度代理的定义出发,对比传统 ReAct 模式的局限性,重点剖析支撑深度代理长时间、复杂任务处理能力的四大关键组件(系统提示、规划工具、子代理、文件系统),并结合 Claude Code ... 登录后查看完整内容
    🎬 VideoDeep agents 02
    1. 课程简介本课程旨在深入解析下一代 AI Agent——“深度代理”的运作机制。课程将从深度代理的定义出发,对比传统 ReAct 模式的局限性,重点剖析支撑深度代理长时间、复杂任务处理能力的四大关键组件(系统提示、规划工具、子代理、文件系统),并结合 Claude Code ... 登录后查看完整内容
    🎬 VideoWhat is a Prompt and Why Does lt Matter?
    Prompt 在大语言模型中的定义与角色:作为模型输入指令,直接影响输出方式与结果Prompt 对 AI 行为的引导机制:如何决定模型“回答什么”以及“如何回答”Prompt 清晰度与输出质量之间的关系,对比模糊 Prompt 与结构化 Prompt 的效果差异Prompt 在控... 登录后查看完整内容
    🎬 VideoHow to Design an Effective Prompt?
    Prompt 设计在 AI 输出质量中的作用,以及 Prompt 结构对准确性与一致性的影响Prompt 过于宽泛与结构清晰之间的输出差异对比通过角色设定(Role Prompting)明确模型视角与回答立场使用约束条件控制输出范围:字数、风格、语气、内容侧重点通过多结果输出设计... 登录后查看完整内容
    🎬 VideoPrompt Templates & Parameter Tuning1
    Prompt Template 在 AI 应用中的作用:通过模板化 Prompt 提升输出一致性、可复用性与工程可控性Prompt 模板的基本结构设计:明确输入格式、输出预期与上下文约束使用占位符(Placeholders)构建可参数化 Prompt:支持动态内容注入与批量生成常... 登录后查看完整内容
    🎬 VideoPrompt Templates & Parameter Tuning 2
    Fine-Tuning 在大模型体系中的定位与作用Fine-Tuning 与从零训练(Training from Scratch)的核心区别基于预训练模型进行任务定制化优化的基本思路Fine-Tuning 的标准工作流程:基于已有预训练模型作为起点引入任务相关的领域数据在保留通用... 登录后查看完整内容
    🎬 VideoData Generation & Fine-Tuning
    使用 AI 生成数据进行模型微调的整体思路与适用场景AI 生成数据在微调中的核心价值:补齐真实业务数据不足的问题减少对大规模人工标注数据的依赖针对特定行业或任务生成高相关性训练样本Prompt 驱动的数据生成方式:通过精心设计的 Prompt 生成结构化、可复用的训练数据控制生成... 登录后查看完整内容
    🎬 VideoSelecting the Right Data for Fine-Tuning
    微调数据在模型效果中的决定性作用:数据质量直接影响模型稳定性与输出可靠性低质量数据对模型的典型负面影响:性能下降、偏见放大、输出不可控微调数据选择的核心判断标准:数据相关性:是否与目标任务和业务场景高度匹配数据多样性:是否覆盖不同情况,避免单一模式或隐性偏差数据质量:准确性、一致... 登录后查看完整内容
    🎬 VideoUnderstanding Model Alignment and Compliance
    模型对齐(Model Alignment)的核心目标与边界:模型行为如何与人类价值、业务规则和社会规范保持一致未对齐模型在真实系统中的风险类型:有害内容、偏见输出、误导性回答与合规风险模型对齐在 AI 系统生命周期中的位置:从数据、训练、推理到上线后的持续治理对齐机制的主要实现路... 登录后查看完整内容
    🎬 VideoUsing Prompts to Generate Alignment Data
    使用 Prompt 生成对齐数据(Alignment Data)的整体思路与作用利用 AI 生成数据来约束和引导模型行为,使输出更贴近人类价值通过 Prompt 设计减少有害、攻击性或不当内容的生成Prompt Engineering 在对齐数据构建中的角色与方法通过结构化 Pr... 登录后查看完整内容
    🎬 VideoReal-World Applications of Model Alignment
    模型对齐(Model Alignment)在真实业务场景中的应用位置与价值内容审核场景中,通过对齐机制过滤有害、误导性或不当内容偏见检测与公平性控制,减少模型输出中的系统性偏差敏感话题处理机制,对法律、医疗、伦理相关问题进行约束与控制未进行模型对齐时,模型可能产生不安全、不合规或... 登录后查看完整内容
    🎬 VideoMethods for Evaluating Data Quality
    Prompt 的定义,以及 Prompt 对大模型回答准确性、稳定性和可控性的影响Prompt 不清晰或结构不合理时,模型输出随机性和偏差产生的原因RAG 系统中测试数据在控制幻觉、偏差和错误回答中的作用RAG 测试数据的主要形式:查询-文档对、标准答案数据、边界与对抗样本检索模... 登录后查看完整内容
    🎬 VideoTest Data Generationfor RAG: In-DepthEvolution
    理解 Prompt 是什么,以及它在 LLM 和 RAG 系统中为什么会直接影响结果质量掌握 好 Prompt 与差 Prompt 的核心区别,避免模糊指令导致随机或无效输出认识 Prompt 在生成、评估和微调数据中的作用,不仅是“提问工具”理解 RAG 中测试数据(Test ... 登录后查看完整内容
    🧪 LabCustom Synthetic Test Data Generation for RAG Evaluation
    学习目标通过本课程的学习,学员将能够:理解合成测试数据在RAG系统评估中的重要性,并掌握合成数据生成的基本技术。学习如何定制化合成数据集,使其符合特定应用场景的需求,模拟实际使用中的复杂输入。掌握评估RAG系统表现的关键指标,结合合成数据分析系统的检索效果和生成质量。深入理解合成... 登录后查看完整内容
    ℹ️ InformationSDG Toolkit
    学习目标 通过本课程的学习,学员将能够: 理解合成数据生成的核心概念、类型和适用场景。 掌握如何根据业务需求构建符合实际的合成数据集,实现数据的多样化和高质量。 学习合成数据在数据隐私保护中的应用,满足数据合规性要求。 探索合成数据的评估方法,确保生成数据集在实际应用中保持高效... 登录后查看完整内容
    🎬 VideoWhy LLM Fine Tuning
    解释什么是模型训练与大模型训练,用直观方式理解“模型、参数、函数”的基本概念从简单数学模型过渡到神经元与神经网络,理解深度学习的基本结构讲清模型训练的核心目标:通过数据和损失函数逼近真实输出介绍梯度下降作为模型训练的基本优化思路,以及学习率的作用对比全量梯度下降、随机梯度下降(S... 登录后查看完整内容
    🎬 VideoWhat is model training
    用直观、通俗的方式理解什么是模型、模型训练与参数从最简单的函数关系出发,理解模型如何从输入映射到输出认识神经元与神经网络的基本结构(权重、偏置、层的概念)理解模型训练的核心目标:让预测结果尽量接近真实结果了解训练所需的两个关键要素:数据集与损失函数建立“模型训练本质是一个优化问题... 登录后查看完整内容
    🎬 VideoWhat is LLM Fine Tuning
    认识什么是大模型微调(LLM Fine-Tuning)以及它在大模型训练流程中的位置理解大模型从预训练到可对话模型的完整训练链路区分 Base Model、Instruct Model 和 Chat Model 的差异了解监督微调(SFT)的基本作用与目标认识偏好对齐阶段及常见方... 登录后查看完整内容
    🎬 Video大模型微调方法
    本节课授课要点讲解大模型从 预训练、监督微调(SFT)到偏好对齐 的整体训练流程介绍 轻量化微调(PEFT) 的核心思想与适用场景重点解析 LoRA / QLoRA 的工作原理及参数规模对训练成本的影响对比 强化学习微调(RLHF / PPO) 的机制与现实工程挑战讲解 DPO(... 登录后查看完整内容
    🎬 VideoHow to fine tune LLM
    大模型微调的现实前提与运行环境选择大模型微调对硬件、显存和运行环境的实际要求本地运行、Jupyter Notebook 的风险与限制使用 Hugging Face 工具评估模型显存占用与运行可行性Colab、Kaggle、RunPod、云厂商 GPU 环境的对比与适用场景监督微调... 登录后查看完整内容
    🎬 Video练习
    理解 Fine-Tuning 在真实工程中的位置回顾什么场景适合 Fine-Tuning,什么场景更适合 RAG / Embedding明确 Fine-Tuning 并不是“提升一切能力”,而是对特定任务分布进行对齐熟悉 Hugging Face 生态在微调与评测中的角色使用 H... 登录后查看完整内容
    🎬 VideoDownloading Open-Source Model Weights
    学习目标- 理解如何从开源平台下载和管理模型权重,掌握处理大规模模型的基本技能- 学习如何确保下载的模型权重能够在不同框架(如TensorFlow、PyTorch)中正确加载和使用- 探索如何通过优化模型权重下载和管理流程,提升开发效率- 提升在实际项目中下载、加载和应用开源模型... 登录后查看完整内容
    🎬 VideoLoading LMs on GPU
    学习目标- 掌握如何将大型语言模型(LMs)加载到GPU上运行,提升模型推理和训练的速度- 理解GPU与CPU加载模型的性能差异,学习如何优化GPU资源以支持大规模模型- 学习如何在实际项目中管理和优化GPU资源,提高语言模型的性能和效率- 提升在使用GPU进行大规模语言模型推理... 登录后查看完整内容
    🎬 Video为什么要使用 Sentence Transformers?
    Sentence Transformers 的核心定位理解 Sentence Transformers 在语义搜索、RAG、相似度计算中的角色它如何将文本统一映射到 embedding 空间,用于检索、排序和匹配数据安全与隐私视角下的选择理由RAG 场景中,所有文档都需要先做 e... 登录后查看完整内容
    🎬 Video准备工作
    完成 Python 开发环境的基础准备讲解为什么在 AI / NLP 项目中推荐使用 Python 虚拟环境,以及在本课程中对 Python 版本的要求,帮助学员建立一个干净、可控的开发环境。熟悉 Python 虚拟环境的创建与激活流程通过示例了解如何使用 venv 创建独立的 ... 登录后查看完整内容
    🎬 Video语义检索
    语义检索的核心思想 本节课介绍语义检索的基本原理:不再依赖关键词匹配,而是将文本(句子、段落或文档)映射到向量空间中,通过向量之间的距离来衡量语义相似度,从而找到“语义上最接近”的内容。查询与文档的向量化过程 讲解如何将语料库中的所有文本与用户查询统一转换为向量表示,使查询和文档... 登录后查看完整内容
    🎬 VideoRetrieve & Re-Rank-检索和重新排序
    检索与重排序的整体流程认知 讲清楚在真实搜索系统中,为什么通常采用“两阶段检索”:先用 Retrieval 模型从大规模语料中快速筛选候选结果,再用 Re-Ranker 对候选结果进行精排,从而在效率和准确率之间取得平衡。Bi-Encoder 与 Cross-Encoder 的核... 登录后查看完整内容
    🎬 Video聚类(Clustering) : 归类相似的文本
    聚类要解决的核心问题与应用场景 介绍聚类的基本目标:将语义相似的文本自动归类,用于用户评论归类、新闻热点整理、电商搜索关键词分析等真实业务场景。传统聚类方法的基本思路 讲解 k-Means、Agglomerative Clustering 等经典聚类算法的核心思想,以及它们在数值... 登录后查看完整内容
    🎬 Video多语言与多模态
    多语言语义检索的核心思路 讲解如何通过多语言 embedding 模型,实现跨语言的语义搜索能力,让用户可以用不同语言查询同一份内容,而系统仍然能够正确理解语义并返回相关结果。多语言模型的选择与适用场景 介绍常见的多语言 Sentence Transformer 模型,以及它们在... 登录后查看完整内容
    🎬 Video模型性能
    模型性能瓶颈与现实问题背景 从大模型参数规模、Embedding 数量、内存占用和推理成本出发,系统解释为什么在真实生产环境中,“模型能跑”远远不够,必须考虑性能、成本与可扩展性。量化(Quantization)在模型优化中的核心作用 梳理从 FP32 到 INT8 / Bina... 登录后查看完整内容
    🧪 LabProject:Fine-Tuning Embedding Models for RAG using LlamaIndex
    学习目标- 掌握如何使用LlamaIndex对嵌入模型进行微调,以优化Retrieval Augmented Generation (RAG)系统中的信息检索和生成任务- 学习如何在RAG系统中利用LlamaIndex微调预训练的Embedding Models,提升检索精度与生... 登录后查看完整内容
    ℹ️ InformationEmbedding Fine-Tuning Toolkit
    学习目标通过本课程的学习,学员将能够:理解Embedding的基本概念和在NLP及相似性搜索中的应用。学习如何使用预训练Embedding并通过微调优化其在特定任务中的表现。掌握嵌入微调的常用方法和工具,提升模型对特定任务的适应性和准确性。使用合适的数据集和策略进行Embeddi... 登录后查看完整内容
    🎬 VideoFine-Tuning Large Language Models
    Fine-Tuning 的核心概念课程首先讲清楚什么是 Fine-Tuning:不是重新训练一个模型,而是在已有的预训练大模型基础上,用更小、更聚焦的数据集,让模型在特定领域或任务上表现得更好。从通用模型到领域专家讲解为什么通用大模型虽然能力全面,但在真实业务场景中往往“不够专业... 登录后查看完整内容
    🎬 VideoWhy Fine-Tuning?
    为什么需要 Fine-Tuning课程首先解释了一个核心问题:通用大模型虽然“什么都会一点”,但在真实业务场景中往往“不够专业、不够贴合”。Fine-Tuning 的目的,就是让模型从“通才”变成“领域专家”,真正解决特定行业或任务的问题。Domain-Specific Adap... 登录后查看完整内容
    🎬 VideoTypes of Fine-Tuning
    Fine-Tuning 的背景与必要性 解释为什么通用大模型在具体业务场景中仍然不够好,以及 Fine-Tuning 在领域适配、任务对齐和用户偏好调整中的作用。Fine-Tuning 的核心应用场景 覆盖领域知识迁移、任务性能提升、模型行为与风格定制等典型使用场景,建立对 Fi... 登录后查看完整内容
    🎬 VideoLORA (Low-Rank Adaptation)
    理解什么是 LLM Fine-Tuning,以及它在 AI 工程中的真实定位 本节课程首先讲清楚 Fine-Tuning 并不是“从零训练一个模型”,而是在已有大模型基础上,通过小规模数据让模型更适配特定任务或业务场景,解决通用模型“不够懂你业务”的问题。掌握为什么工程实践中更常... 登录后查看完整内容
    🎬 VideoParameter Efficient Fine-Tuning (PEFT)
    Fine-Tuning 在 AI 工程中的真实作用 课程从工程视角解释什么是 Fine-Tuning,以及它在实际 AI 系统中的位置。不是为了“训练一个新模型”,而是让通用大模型在特定业务场景中更稳定、更准确、更可控地工作。为什么不是所有问题都靠 Prompt 解决 对比 Pr... 登录后查看完整内容
    🎬 VideoThe “Problem“ with LLMs
    理解大模型真正的“性能瓶颈”来自哪里 从 LLM 的参数规模出发,理解为什么模型在推理阶段会遇到显著的内存与计算压力,以及为什么“存得下、跑得动”本身就是工程问题,而不只是模型能力问题。认识数值表示方式对模型性能的决定性影响 通过 FP32、FP16 等浮点数表示方式的对比,理解... 登录后查看完整内容
    🎬 VideoMemory Constraints
    什么是 Quantization 量化是一种通过降低数值精度来表示模型参数和计算过程的工程技术,用于在尽量保持模型效果的前提下,减少模型体积并提升推理效率。为什么大模型必须考虑量化 随着模型参数规模快速增长,使用高精度浮点数会带来巨大的内存和计算成本,量化是让大模型在现实硬件环境... 登录后查看完整内容
    🎬 VideoIntroduction to Quantization
    Quantization 的基本定义与目的 量化(Quantization)本质上是在模型中降低数值精度的过程,通过把高精度浮点数(如 FP32)转换为低精度表示(如 INT8),在尽量保持模型效果的前提下,显著减少计算和存储成本。为什么量化在工程中非常重要 量化直接影响模型的体... 登录后查看完整内容
    🎬 VideoTypes of Data Representations in Al
    模型量化的工程背景与价值 解释为什么 AI 模型在训练阶段通常使用高精度浮点数,而在上线推理阶段需要通过量化来降低计算成本、提升推理速度和资源利用率。AI 中常见的数据表示方式 对比 FP32、FP16、BF16 与 INT8 / INT4 等数据表示形式,说明它们在训练、推理和... 登录后查看完整内容
    🎬 VideoHow Quantization Works?
    了解量化(Quantization)在模型推理中的核心作用 本节课首先帮助你建立一个整体认知:为什么在真实 AI 系统中,需要把 FP32 的模型权重和计算过程,转换成 INT8 / INT4。你会理解量化并不是“牺牲模型质量”,而是在可控精度损失下,大幅提升推理速度、降低显存和... 登录后查看完整内容
    🎬 VideoAsymmetric Quantization
    Asymmetric Quantization(非对称量化),以及它与 Symmetric Quantization 的核心区别,重点理解为什么在真实模型中,数值分布往往并不以 0 为中心。通过可视化示意图,解释浮点数范围(FP32)如何映射到 INT8 的离散区间,重点理解 z... 登录后查看完整内容
    🎬 VideoModel Quantization in Practice
    讲解模型量化在真实 AI 项目中的作用,帮助你理解为什么在生产环境中需要对模型进行量化处理,而不仅停留在实验或理论阶段。通过一个完整的量化项目实战,系统展示从模型训练、量化处理到推理性能调优的完整工程流程,理解量化在效果、性能和资源消耗之间的取舍。结合多个实际应用场景,分析量化技... 登录后查看完整内容
    🧪 LabProject:Fine-Tuning Llama 3.1 with PEFT-QLoRA
    学习目标通过本课程的学习,学员将能够:理解Llama 3.1模型的基础结构和应用场景。学习PEFT(Parameter-Efficient Fine-Tuning)和QLoRA(Quantized Low-Rank Adaptation)的核心概念和工作原理。掌握在低资源环境中应... 登录后查看完整内容
    🎬 VideoLinkedin & CV 2024.12.08
    Linkedin & CV 2024.12.08
    1v1免费职业咨询