我没有任何编程基础，能学AI Engineer核心技术实战课吗？

- 工作忙、时间零散，但想系统学习 AI 工程的人 - 想先自学一遍，再决定是否进入 Bootcamp 的人 - 自驱型学习者（喜欢自己推敲、边学边敲代码） - 想转型 AI Engineer 但预算有限的学习者 - 想把课程当“长期技术手册”的人

AI Engineer核心技术实战课是线上课还是线下课？我在悉尼/墨尔本能去教室上课吗？

两种方式都有，你可以根据自己情况选择。线上的话，我们有直播课，可以实时提问互动，错过了也能看回放。线下教室目前在悉尼、墨尔本、布里斯班都有，你可以来现场跟老师面对面学习。很多同学是平时看线上课，周末有时间就来教室做项目、问问题。另外我们还有在线的编程实验室，可以直接在浏览器里写代码练习，挺方便的。

学完AI Engineer核心技术实战课真的能在澳洲找到IT工作吗？就业情况怎么样？

说实话，找工作这事没人能打包票，但我们学员的就业情况确实不错，历届就业率在90%以上。不少学员去了Atlassian、Canva、REA、四大银行这些大公司。我们除了教技术，还会帮你改简历、优化LinkedIn、做模拟面试，有些岗位还能帮忙内推。当然最重要的还是你自己得认真学、多练习，光上课不动手肯定不行。

报名AI Engineer核心技术实战课之前需要准备什么？有入学要求吗？

没有硬性的入学门槛。不过有几点建议：首先你得会基本的电脑操作，这个应该没问题；其次英语阅读能力要还行，因为很多技术文档都是英文的，不需要多好，能看懂就行；最重要的是时间，每周最好能保证15到20小时学习，包括上课、做作业、练项目。如果你工作很忙，可能需要考虑下时间安排。

AI Engineer核心技术实战课学费多少钱？能分期付款吗？

课程费用是 $3,999 澳币。我知道这不是小数目，所以我们有几种方式可以减轻压力：提前报名有早鸟优惠；如果是老学员推荐来的，双方都有折扣；支持分期付款，6期或12期都可以，没有利息；在校学生拿学生证还有额外优惠。具体能优惠多少，建议直接问课程顾问，因为不同时期活动不一样。

AI Engineer核心技术实战课要学多久？我平时上班，时间够吗？

整个课程大概3到6个月，具体看你的学习进度。时间安排大概是这样：每周有2到4小时的直播课，然后自己看视频、做作业大概8到10小时，再加上做项目的时间。算下来每周差不多15到20小时。如果你工作很忙，进度可以放慢一点，我们不会催你。所有直播课都有录播，什么时候看都行。不少学员都是边上班边学的，周末多花点时间，完全可以搞定。

匠人学院和其他IT培训机构比，有什么不一样？

说几个我觉得比较重要的点吧。首先我们专门针对澳洲市场，教的东西都是澳洲公司实际在用的技术栈，不是那种放之四海皆准但哪儿都不精的内容。然后我们有真实的企业项目可以做，不是那种demo级别的小作业，出去面试的时候能拿得出手。导师这块，很多都是在Google、Meta、Amazon这些大厂工作过的，实战经验很丰富。班级人数控制在15到20人，不会出现几百人一起上课、问问题没人理的情况。另外这个课程的特色是：完整对标 AI Engineer Bootcamp 的课程体系、灵活学习、无限回看、不怕错过任何细节、适合作为长期“AI 工程知识库”反复使用、成本更友好，是入门 AI 工程最实用的开始方式。毕业之后我们也一直提供支持，不是学完就不管了。

zh | 匠人学院 - 学AI·AI教程·AI入门 | 全球华人学习 AI 第一站

ℹ️ InformationPre-work

课前准备说明必要的知识储备为确保学员能够顺利完成本课程并有效掌握内容，建议具备以下基础知识：Python编程基础：了解Python的基本语法和数据操作，以便在课程中顺利完成代码编写和调试。会写RESTful API，熟悉CRUD的API搭建，可以任意用语言，最好是python，j... 登录后查看完整内容

ℹ️ InformationPreparation

Preparation

🎬 VideoGenerative Al & productivity

在这节课中，你将系统理解生成式 AI（Generative AI）在真实商业世界中究竟能做些什么，以及企业为什么如此重视 AI 能力。课程从 GenAI 的三大应用方向出发，带你了解 AI 如何提升用户体验、增强员工生产力、优化企业业务流程。随后，你会第一次接触 AI Engin... 登录后查看完整内容

🎬 VideoGenAl Concept

本节课程作为AI Engineer训练营的重要基础模块，围绕“Foundation Models（基础模型）”的核心概念展开，带领学习者理解生成式人工智能的底层原理及其典型应用形式。通过介绍从原始数据到预训练语言模型（LLM）的演化过程，结合提示工程（Prompt Enginee... 登录后查看完整内容

🎬 VideoPrompt Engineering

本节课程将系统性介绍 Prompt Engineering（提示工程）的核心概念、常见提示类型、设计策略与最佳实践。内容从“什么是 Prompt”出发，逐步延伸到 Zero-shot / Few-shot、Chain-of-Thought、Role Prompting 等关键方法... 登录后查看完整内容

🎬 VideoRAG

理解 RAG（Retrieval-Augmented Generation）在 AI 工程中的角色本节课程深入讲解 RAG 如何通过结合大语言模型（LLMs）和向量数据库来提升 AI 模型的推理能力，特别是在提供更精准的语义搜索和答案生成方面。掌握 RAG 系统架构与流程课程通过... 登录后查看完整内容

🎬 VideoGenAl Agents

本节课将系统讲解 LLM 驱动的智能体（Agent）是如何被设计、组合并在真实系统中运行的，帮助学员从“会用模型”进阶到“能设计 Agent 系统”。Agent 的核心组成与工作机制从系统视角拆解一个完整 Agent，而不是只停留在 Prompt 层面：Agent 核心角色：作为... 登录后查看完整内容

🎬 VideoGenerative Al Ops

生成式 AI 的完整组成公式理解一套可落地的生成式 AI 架构：👉 模型（Foundation Models）+ Prompt + 领域数据 = 可用的 AI 应用什么是 Generative AI Ops（不是只写 Prompt）认识 Generative AI Ops = ... 登录后查看完整内容

🎬 VideoStructured Data vs Unstructured Data

🎬 VideoIntroduction to Machine Learning

🎬 VideoSupervised, Unsupervised, and Reinforcement learning

在本节课程中，我们将深入探讨三种主要的机器学习类型——监督学习、非监督学习和强化学习，帮助您更清晰地理解这些核心概念：监督学习：适用于带标签的数据。在监督学习中，模型通过已知的输入和输出关系进行训练，用于分类和预测。例如，我们可以通过带有“狗”或“非狗”标签的图片数据集训练模型，... 登录后查看完整内容

🎬 VideoIntroduction to Deep Learning

🎬 VideoThe transformer architecture

在本节课程中，我们将详细讲解变换器（Transformers）架构，深入探索其在自然语言处理（NLP）任务中的强大功能。您将学习变换器如何通过其编码器-解码器架构，一次性处理所有输入，提升翻译和文本生成等任务的效率和精确度。课程主要内容包括：变换器的整体架构：介绍变换器的编码器-... 登录后查看完整内容

🎬 VideoInput embeddings

在本节课程中，我们将详细讲解变换器架构的**输入嵌入（input embeddings）**过程，这是实现自然语言处理的第一步。该步骤将文本转换为数值表示，使得模型能够处理和理解语言中的语义和上下文信息。课程内容包括：标记化（Tokenization）：将输入文本分解为标记（如单... 登录后查看完整内容

✍️ AssignmentGenAI Capstone Project：intelligent Study Assistant(ISA)

GenAI Capstone Project: Intelligent Study Assistant (ISA)🎯 Use CaseStudents often struggle to find tailored study materials, answ... 登录后查看完整内容

🎬 VideoNatural Language Processing(NLP)

Transformer Architecture 课程介绍学习目标本课程旨在为学生提供对Transformer架构的深入理解。通过该课程，学生将学习以下内容：Transformer模型的核心组成部分及其工作机制。如何应用Self-Attention机制来处理自然语言处理任务。理解... 登录后查看完整内容

🎬 VideoTransformer and Attention

本节课你将学到什么？传统文本编码方法的局限了解为什么早期的词袋模型、One-hot 编码维度高、语义弱，难以真正理解语言含义。Embedding 的核心思想学习如何用向量表示词和句子，让模型“感知”词与词之间的语义关系。从文本到任务输出的完整流程理解文本 → Embedding ... 登录后查看完整内容

🎬 VideoLanguage Models (LM)

为什么传统方法不够用传统基于词频 / n-gram 的统计方法维度爆炸，无法覆盖真实语言复杂性难以捕捉词与词之间的语义关系Embedding 的核心作用将词 / 句子映射为向量，保留语义信息相似含义的词在向量空间中距离更近为后续模型理解语言打基础语言模型是什么本质是：对“下一个词... 登录后查看完整内容

🎬 VideoPrompting

🎬 VideoFine-Tuning

🎬 VideoRAG 1

🎬 VideoRAG 2

🎬 VideoAgents

🎬 VideoBenefits and When to Use

🎬 VideoPrompt Engineering: Best Practices

🎬 VideoPrompt Iteration through a User Interface

学习目标掌握如何通过用户界面进行Prompt Iteration，提高提示的精确性与生成模型的输出质量学习如何设计和优化用户界面以支持Prompt的快速迭代与调试理解如何通过用户反馈和交互优化Prompt，从而提升模型在实际应用中的表现提升在实际项目中通过用户界面实现Prompt... 登录后查看完整内容

🧪 LabProject：Building and Sharing Your First GPT in OpenAI’s GPT Store

学习目标- 掌握如何在OpenAI的GPT Store中构建并分享你的第一个GPT应用- 学习如何设计、开发和部署GPT应用，并确保其符合GPT Store的发布要求- 理解如何优化GPT应用的用户体验与性能，以提升用户满意度和应用效果- 提升在实际项目中使用OpenAI的工具和... 登录后查看完整内容

ℹ️ InformationChatGPT Prompt Set

ℹ️ InformationGenAI Toolbox

🎬 VideoUnderstanding LLMs: Capabilities, Limits & Engineering Solutions）

🎬 VideoRAG基本架构

本节课程内容总结RAG 的核心思想与整体流程介绍 Retrieval-Augmented Generation 的基本概念，理解为什么在大语言模型存在幻觉、知识过期、上下文受限的情况下，需要通过“检索 + 生成”的方式来增强回答能力。从原始数据 → 信息抽取 → 分块（chunk... 登录后查看完整内容

🎬 VideoEmbedding嵌入模型

🎬 Video向量数据库

本节课程内容概览：向量数据库（Vector Database）向量数据库的核心概念与作用介绍什么是向量数据库，以及它在 AI 系统中的基本职责：存储、管理和检索向量嵌入（embeddings）。理解文本、图片等非结构化数据是如何被转换为向量，并用于相似度搜索的。向量数据库在 RA... 登录后查看完整内容

🎬 VideoNative RAG存在的问题

本节课学习目标理解为什么最基础的 Native RAG 在真实场景中容易“效果不稳定”能清晰区分 RAG 系统中检索阶段、生成阶段、拼接阶段各自可能出现的问题建立对「RAG 不是万能方案」的工程认知，为后续 RAG 优化方案打基础核心知识点讲解1. 检索阶段的问题：精度与召... 登录后查看完整内容

🎬 VideoAdvanced RAG 与 Agentic RAG：从基础检索到可控推理流程

本节课学习目标通过本节课，学员将能够：理解 Naive RAG 与 Advanced RAG 的结构差异明确为什么在真实系统中需要引入 Pre-Retrieval / Post-Retrieval 机制认识 Agentic RAG 的核心思想：让模型参与检索与决策流程建立对 “R... 登录后查看完整内容

🎬 VideoContextual RAG

本节课程：Contextual RAG（上下文感知检索）本节学习目标理解为什么传统 RAG 在 chunk 粒度检索上会丢失上下文掌握 Contextual Retrieval（上下文感知检索）的核心思路能判断在实际系统中，是否值得为效果提升付出额外的成本与延迟核心课程内容Co... 登录后查看完整内容

🧪 LabProject：Building RAG from Scratch in Python

🎬 VideoWhat are API Rate Limits? - OpenAl

本节课学习目标明确什么是 API Rate Limits，以及 OpenAI 中常见的限流指标和触发机制理解为什么在真实系统中必须引入限流与请求控制知道在遇到限流问题时，工程上常用的应对与优化方式核心知识点讲解API Rate Limits 的定义与指标请求在单位时间内的数量限制... 登录后查看完整内容

🎬 VideoAzure OpenAl: Quotas, Rate Limiting, and PTUs

本节课学习目标明确 OpenAI / Azure OpenAI 的资源限制机制，理解为什么在真实系统中必须考虑配额与限流理解 Quota、Rate Limit、TPM、RPM、PTU 等核心概念在实际调用中的作用差异能根据业务场景，在 Pay-as-you-go 与 PTU 之间... 登录后查看完整内容

🎬 VideoPdf Parsing

使用 Python 对结构复杂的 PDF 文档进行解析，提取表格、段落等可用于后续处理的文本内容将 PDF 文档内容按页或语义进行切分（chunking），构建适合向量化与检索的数据结构基于 Sentence Transformers 生成文本 embedding，并使用 FAI... 登录后查看完整内容

🎬 Videoinvoice processing

Python 发票处理与简单界面构建本节课学习目标通过一个完整的 Invoice Processing 场景，串起 OCR、LLM 结构化抽取与 Python 前端界面理解真实企业中“文档 → 结构化数据 → 可交互工具”的完整技术链路构建一个可运行、可交互的发票处理小应用原型核... 登录后查看完整内容

🧪 LabProject：Shipping and Sharing a Rate-Unlimited, PDF-UploadReady RAG Application

学习目标- 掌握如何构建和部署一个Rate-Unlimited、支持PDF上传的Retrieval Augmented Generation (RAG)应用- 学习如何实现PDF解析与RAG系统的集成，提供高效的文档检索和生成能力- 理解如何设计Rate-Unlimited系统，... 登录后查看完整内容

🎬 VideoAgent详解：构建第一个Agent

本节课学习目标用最短路径搭出一个可运行的 AI Agent 原型：能对话、能调用工具、能形成完整的执行闭环搞清楚“Agent 和普通 ChatBot”的区别：不只是回答问题，而是会计划、会行动、会复盘具备从 Demo 走向可扩展架构的能力：从 create_react_agent... 登录后查看完整内容

ℹ️ InformationRAG Builder Toolbox

学习目标本课程旨在为学习者提供构建和优化检索增强生成（Retrieval-Augmented Generation, RAG）系统的全面工具箱。通过本课程的学习，学员将深入理解RAG的核心概念，学习如何使用先进的检索与生成技术优化RAG管道，并在实际项目中实现多智能体LLM（大... 登录后查看完整内容

ℹ️ InformationAI Resource Hub

学习目标  - 掌握如何使用RAG Builder Toolbox构建和优化Retrieval Augmented Generation (RAG) 系统  - 学习使用工具箱中的不同模块来实现信息检索、嵌入生成和文本生成  - 理解如何通过集成现有... 登录后查看完整内容

🎬 VideoBudgeting and API costs

ℹ️ InformationEnd-to-End RAG Toolbox

学习目标  - 掌握使用End-to-End RAG Toolbox构建完整的Retrieval Augmented Generation (RAG)系统的技能  - 理解RAG系统的核心组件及其在信息检索和生成中的应用  - 学习如何通过工具箱实现... 登录后查看完整内容

🎬 Video用 AWS 构建 RAG应用

授课老师：Peiyao你将学到什么这节课将带你从工程视角理解并实现一套完整的 RAG 系统，包括：为什么企业更倾向于 RAG，而不是直接 Fine-tuning如何根据业务场景，选择 Prompt Engineering / RAG / Fine-tuning 的正确路径RAG ... 登录后查看完整内容

🎬 VideoIntroduction to LangChain

ℹ️ InformationProduction RAG Toolbox

学习目标  - 掌握如何使用Production RAG Toolbox构建和优化面向生产环境的Retrieval Augmented Generation (RAG) 系统  - 理解RAG系统的核心组件在生产环境中的应用与最佳实践  - 学习如何... 登录后查看完整内容

🎬 VideoLangChain Core Constructs

🎬 VideoLangChain 架构层次

🎬 VideoChat Models-深入

本节课学习目标以工程视角理解 Chat Models 在真实 AI 应用中的使用方式搭建清晰的 Chat Message 结构，为后续 RAG、Function Calling、Agent 奠定基础明确模型参数与输出行为之间的关系，避免“黑盒式调用”核心知识点讲解1. Chat ... 登录后查看完整内容

🎬 VideoPrompt Templates-高级技巧

本节课学习目标将零散的 Prompt 编写方式系统化，转化为可复用、可维护的模板设计支持复杂业务场景下的动态输入、多轮上下文与稳定输出为后续 RAG、Agent、自动化流程中的 Prompt 管理打基础核心知识点讲解1. Prompt Template 的基本结构模板化 Prom... 登录后查看完整内容

🎬 VideoOutput Parsers-实战

本节课围绕如何将大模型输出从“不稳定的自然语言”转化为“可直接被程序使用的结构化结果” 展开，重点讲解多种 Output Parser 在真实 AI 工程中的使用方式与适用场景。1. 大模型输出不确定性的问题大模型默认输出为自由文本，格式不稳定不同 prompt、tempera... 登录后查看完整内容

🎬 VideoRetrieval-向量存储

本节课程内容概述向量存储在 RAG 系统中的角色与位置文档如何从原始文本转化为可检索的向量表示（Embedding → Vector Store）向量存储与传统数据库 / 搜索引擎的核心差异基于语义相似度的检索流程（Query → Embedding → 相似度搜索）主流向量数据... 登录后查看完整内容

🎬 VideoDocument loaders

本节课内容概述（Document Loaders & Text Splitters）不同数据来源在 RAG 系统中的角色与差异：本地文本文件、结构化文档、网页内容、数据库数据常见 Document Loader 类型与适用场景：文本类：TextLoader、CSVLoad... 登录后查看完整内容

🎬 VideoLangchain Expressio Nlanguage LCEL

本节课程系统讲解 LangChain 中 LCEL（LangChain Expression Language）的核心设计思想与实战用法，带你从「单一 Prompt + Model」逐步构建可组合、可调试、可扩展、可上线的 AI 应用链路。课程重点不在“写 Prompt”，而在... 登录后查看完整内容

🎬 VideoLangsmith

本节课程围绕 LangSmith 在真实 AI 工程中的落地使用展开，系统讲解如何通过 LangSmith 对基于 LangChain 的 LLM 应用进行全链路追踪、调试、评估与生产监控。课程从 LangSmith 的核心价值与使用场景入手，带你理解 Trace / Run 的... 登录后查看完整内容

🎬 VideoCode Examples

课程以 LCEL（LangChain Expression Language）为核心，逐步演示 Prompt Template、Output Parser、RAG、并行执行与多链组合等关键能力，帮助学员真正理解 “链是如何被一步步拼出来的”，并掌握将零散能力组合成可复用 AI W... 登录后查看完整内容

🎬 VideoAgents & Tools

本节课程将聚焦 Agent 与 Tool 的实际工程用法，带你从“单纯调用 LLM”升级到“让模型会用工具、能自主决策”的 Agent 系统。课程通过 LangChain 的 @tool 机制与 ReAct Agent 实例，演示如何为大模型定义可调用的外部工具（如计算、搜索），... 登录后查看完整内容

🎬 VideoMemory 系统

本节课程围绕 LangChain Core Constructs 中的 Memory 模块展开，系统讲解 Memory 在 LangChain 链式调用中的设计理念与基础用法。课程将从「为什么 LLM 默认是无状态的」这一核心问题出发，结合 ConversationBuffer... 登录后查看完整内容

🎬 VideoLangChain与外部数据源的集成

本节课程系统讲解为什么仅依赖大模型自身知识无法满足真实业务需求，以及 LangChain 如何通过标准化的 Chain、Runnable 和 Tool 机制，将数据库和外部 API 等数据源引入到大模型推理流程中，构建具备实时性和业务上下文的 AI 应用。本节课程目标理解大模型在... 登录后查看完整内容

🎬 VideoSQL 数据库集成

这节课程将讲解 LangChain 如何将结构化业务数据接入到大模型推理流程中。通过标准化的 SQLDatabase 与 SQLDatabaseChain 组件，演示如何让 LLM 在不直接编写 SQL 的情况下，安全、可控地查询数据库，并将查询结果作为上下文参与模型生成，为企业... 登录后查看完整内容

🎬 VideoREST API集成

讲解如何将外部 Web API 封装为 LangChain 可调用的工具（Tool），并通过 Agent 调度实现模型与实时外部服务的协同工作，使 LLM 能够在推理过程中主动获取最新、动态的数据。本节课程目标理解为什么 REST API 是 LLM 系统中最常见的外部数据来源掌... 登录后查看完整内容

🎬 VideoMonitoring and Visibility with LangSmith

本节课程聚焦 LangSmith 在生成式 AI 应用中的监控与可观测性能力，系统讲解如何对基于 LangChain 的 LLM 应用进行运行追踪、日志记录、性能分析与结果评估。通过 LangSmith，开发者可以清晰地看到每一次模型调用、链路执行与工具使用的真实运行情况，从而将... 登录后查看完整内容

🎬 VideoLLMs Overview

这节课会从工程与系统视角出发，系统梳理大语言模型（LLMs）能力边界与演进路径的理论课程。本节课将帮助学员理解：LLM 能解决什么问题、为什么会出现幻觉、以及在真实生产环境中为何需要 RAG（Retrieval-Augmented Generation）等增强方案。这节课课程由 ... 登录后查看完整内容

🧪 LabProject：Building and Sharing your First RAG QA Application with LangChain

学习目标- 掌握如何使用LangChain从零构建一个Retrieval Augmented Generation (RAG) 问答 (QA) 应用- 理解RAG系统的核心构件及其在知识问答中的应用- 学习如何将文档检索与生成模型相结合，以实现高效的问答功能- 学会如何分享和部署... 登录后查看完整内容

🎬 VideoRAG Review

🎬 VideoTraditional Retrieval Evaluation Metrics

本节课围绕 RAG（Retrieval-Augmented Generation）系统的评估方法展开，系统性回顾 RAG 的完整流程，并重点讲解在真实 AI 工程场景中，如何通过科学的 Evaluation 指标判断一个 RAG 系统“是否真的好用”。课程从传统信息检索指标出发，... 登录后查看完整内容

🎬 VideoLLM Generation Evaluation Metrics

本节课系统讲解大语言模型（LLM）生成结果的评估方法，帮助学员从“模型能不能跑”进阶到“模型生成得好不好、是否可靠、是否可上线”。课程围绕文本质量、内容准确性与相关性，以及安全与合规三大维度，建立一套工程上可落地的 LLM 生成评估思路，为后续 RAG 系统评估与生产级 AI 应... 登录后查看完整内容

🎬 VideoRAG Evaluation1

本节课聚焦于RAG（Retrieval-Augmented Generation）系统的评估策略，帮助学员从整体视角理解“一个 RAG 系统好不好”应该如何判断。课程不局限于单一指标，而是系统梳理当前业界常用的几类 RAG 评估方法，包括人工评估、传统指标评估、LLM-as-Ju... 登录后查看完整内容

🎬 VideoRAG Evaluation Frameworks

本节课聚焦 RAG 系统的系统化评估方法，从“为什么仅靠效果演示不够”出发，系统介绍当前业界主流的 RAG Evaluation Frameworks，重点讲解 TruLens 与 RAGAS 两套工具的设计理念、评估维度与适用场景。通过本节内容，学员将理解如何从 Query、C... 登录后查看完整内容

🎬 VideoRAGAS evaluation Metrics

本节课将系统讲解 RAGAS（Retrieval-Augmented Generation Assessment System）在 RAG 系统评估中的核心思想与实战用法，帮助学员从“能跑的 RAG”进阶到“可量化、可优化的 RAG”。课程将围绕 RAGAS 的整体评估框架、核... 登录后查看完整内容

🎬 VideoMetrics: Context Recall, Context Precision, Answer Relevancy, and Faithfulness

学习目标- 掌握Metrics中的核心概念，包括Context Recall、Context Precision、Answer Relevancy和Faithfulness- 理解这些指标在评估生成式AI和Retrieval Augmented Generation (RAG)系... 登录后查看完整内容

🎬 VideoRAGAS代码实操

本节课是 RAGAS Evaluation Metrics 的配套实操课程，重点不再停留在“指标概念”，而是完整跑通一套 RAGAS 的代码级评估流程，理解 RAGAS 在真实 AI 工程中的使用方式。课程核心内容1. 环境与项目结构初始化讲解如何配置 RAGAS 实验环境，包括... 登录后查看完整内容

🎬 VideoLangfuse

本节课系统介绍了 Langfuse 作为开源 LLM Engineering 平台，如何在真实生产环境中帮助 AI Engineer 对 LLM / RAG / Agent 应用进行全链路可观测、评估、调试与持续优化。课程从 Generative AI 的工程化生命周期出发，覆盖... 登录后查看完整内容

🎬 VideoRAG Asessment (RAGAS) Framework 2

RAGAS 框架核心指标拆解理解 RAGAS 如何从多个维度评估一个 RAG 系统：Answer Correctness：答案是否正确、有无幻觉Answer Relevancy：回答是否真正回应了用户问题Context Precision：检索到的内容是否“用得上”Context... 登录后查看完整内容

ℹ️ InformationRAG Evaluation Toolbox

学习目标  - 掌握如何使用RAG Evaluation Toolbox评估Retrieval Augmented Generation (RAG)系统的性能  - 学习如何设计和应用关键评估指标来衡量RAG系统的检索和生成质量  - 理解如何通过R... 登录后查看完整内容

🎬 VideoAgents

介绍什么是 AI Agent，以及它与普通 LLM 的区别讲清 AI Agent 的核心组成：目标、工具、记忆、规划与行动梳理 AI Agent 的基本工作流程（目标 → 信息 → 执行 → 反馈）理解 Agent 如何从“回答问题”升级为“自主完成任务”为后续 Multi-Ag... 登录后查看完整内容

🎬 VideoThe Reasoning-Action (ReAct) Framework

介绍 ReAct（Reasoning-Action）框架在 AI Agent 构建中的核心思想与工程实现方式。通过将「思考（Reasoning）」与「行动（Action）」显式结合，ReAct 让大模型在解决复杂问题时，能够边推理、边调用工具、边修正路径，从而显著提升 Agen... 登录后查看完整内容

🎬 VideoSearch and Retrieval with Tools (Function Calling)

课程围绕 Function Calling 在搜索与信息检索场景中的实际应用展开，系统讲解如何让 LLM 从“只能生成文本”，升级为“可以主动调用工具、访问外部数据、完成复杂任务的智能 Agent”。课程通过 Search / Retrieval 场景，结合 ReAct 思想与... 登录后查看完整内容

🧪 LabProject：Building a production-grade Agentic RAG Application

学习目标- 掌握如何构建一个面向生产环境的Agentic RAG (Retrieval Augmented Generation) 应用- 理解如何通过Agents增强RAG系统的自动化与决策能力- 学习如何将文档检索、生成模型和Agents无缝集成，实现复杂的动态任务执行- 提... 登录后查看完整内容

ℹ️ InformationProduction Agents Application Toolbox

学习目标通过本课程的学习，学员将能够：掌握智能Agent系统的基本原理与架构设计。学习多智能体（Multi-Agent）协同工作的方法和策略，实现Agent间的无缝协作。了解如何在生产环境中优化智能Agent系统的性能和效率，以处理大规模并发任务。掌握监控与自动化调试的技术，确保... 登录后查看完整内容

🎬 VideoMulti-Agent Systems

MAS 基本概念：介绍什么是多智能体系统（Multi-Agent Systems），以及多个具备自主决策能力的 Agent 如何协同或竞争以完成复杂目标。核心运行机制：理解 Agent 之间的协作、协调与分工模式，以及它们在系统中各自承担的角色。复杂问题解决能力：说明 MAS 在... 登录后查看完整内容

🎬 VideoNetwork of Agents

架构理念：介绍 Network of Agents 多智能体架构，多个 Agent 独立运行、相互通信、协作完成复杂任务。协作方式：Agent 之间通过任务路由与信息交换实现去中心化协作，而非单一控制节点。优势认知：强调该模式在探索性问题、研究型任务中具备灵活性与并行能力。核心挑... 登录后查看完整内容

🎬 VideoSupervisor Agent Approach

介绍 Supervisor Agent 架构的基本概念：由一个中心 Supervisor 统一管理多个子 Agent讲解 Supervisor 在多 Agent 系统中的核心职责：任务拆分、路由分发与结果汇总理解子 Agent 的角色定位：专注单一能力或领域，只负责执行，不做全局... 登录后查看完整内容

🎬 VideoHierarchical Supervisor Systems

什么是分层 Supervisor 多智能体架构分层结构如何工作（Top → Mid → Sub Agents）任务在层级中的流转方式分层监督系统中的通信机制这种架构解决了哪些实际问题适合使用 Hierarchical Supervisor Systems 的场景

🎬 VideoCommunication Mechanisms in Multi-Agent Systems

1. 为什么通信机制决定了多 Agent 系统的上限2. Shared State Communication（共享状态通信）3. Tool Call-Based Communication（基于工具调用的通信）4. Mixed Communication States（混合通信... 登录后查看完整内容

🎬 VideoWhat is LangSmith

把 LLM 应用当成工程系统而不是黑盒模型来对待让 Prompt、Agent、Tool 调用变得可见、可评估、可复盘为后续复杂 Agent、MCP、多工具系统提供工程级基础设施支持

🎬 VideoAgent Demo展示

本节课通过一个完整的 Agent Demo，串联起从任务设计 → Agent 编排 → 工具调用 → 运行与观测的全过程，重点理解 “Agent 是如何真正跑起来的”。1. Agent 的真实工作方式：从 Prompt 到 Task将“一个想法”拆解为明确、可执行的 Tas... 登录后查看完整内容

🎬 VideoHierarchical, Multi-Agent Collaboration, Agent Supervision

🎬 VideoMulti-Agent Frameworks: AutoGen, CrewAI

学习目标- 理解Multi-Agent Frameworks的核心概念，并学习如何使用AutoGen和CrewA构建多Agent系统- 掌握如何通过这些框架设计、部署和管理多个Agents，处理复杂任务- 学习如何优化Agents之间的协作与通信，提升系统的任务执行效率- 探索如... 登录后查看完整内容

🧪 LabProject：Building a Multi-Agent RAG Application with LangGraph

学习目标- 掌握如何使用LangGraph构建一个多Agent的Retrieval Augmented Generation (RAG)应用- 理解如何通过多Agent架构实现任务分工、信息检索与生成的自动化协作- 学习如何优化多Agent系统的通信与任务调度，提升RAG应用的执... 登录后查看完整内容

ℹ️ InformationMulti-Agent Application Toolbox

学习目标  - 掌握使用Multi-Agent Application Toolbox构建和管理多Agent系统的核心技能  - 理解如何通过工具箱中的组件实现多Agent任务分工、协作与通信优化  - 学习如何利用Multi-Agent Appli... 登录后查看完整内容

🎬 VideoIntroducing the Model Context Protocol(MCP)

注册API Keys、Introducing the Model Context Protocol(MCP)为什么需要 MCP：从 M×N 集成混乱说起拆解大模型在真实工程中的核心缺陷：无法访问实时数据、环境上下文、私有与企业信息解释传统 Function Calling / A... 登录后查看完整内容

🎬 VideoMCP Server

MCP Server 在整个 AI 工程体系中的真实位置AI Agent 如何“合法、安全、可扩展”地调用真实世界工具独立实现一个可被 LLM 使用的 MCP Server为后续多 Agent、复杂工具编排、企业级 AI 系统打下架构基础MCP 要解决的核心问题：M×N 集成... 登录后查看完整内容

🎬 Video解读原码

从源码视角理解 MCP 整体架构拆解 MCP Host、Client、Server 的真实职责分工，理解它们在代码中的入口、调用关系，以及如何协同完成一次完整的工具调用流程。深入 STDIO Transport 的底层通信机制结合 Node.js / TypeScript 源... 登录后查看完整内容

🎬 VideoIntegrating MCP (Mixture of Content Providers) into AI Engineering

本节课内容要点MCP（Model Context Protocol / Mixture of Content Providers）的整体架构与设计目标Function Calling 在 MCP 中的角色：从模型意图识别到工具执行的完整链路MCP Host / Client / ... 登录后查看完整内容

🎬 VideoBuilding a MCP Project 01

Deep Agent / MCP 的整体架构认知解释什么是 Deep Agent，以及为什么需要从“单轮对话模型”升级为“可规划、可执行、可追踪的智能体系统”。基于 LangGraph 的 Agent Graph 设计通过 graph.ts 和 createReactAgen... 登录后查看完整内容

🎬 VideoBuilding a MCP Project 02

Deep Agents 与多智能体系统设计本节课将带你从「单一 LLM 调用」正式升级到 AI Agent Engineering 的核心能力，系统性讲解 Deep Agents（深度代理）与多智能体架构的真实工程实现方式。你将学习如何将大模型构建为一个可规划、可拆解任务、可... 登录后查看完整内容

🎬 VideoDeep agents 01

1. 课程简介本课程旨在深入解析下一代 AI Agent——“深度代理”的运作机制。课程将从深度代理的定义出发，对比传统 ReAct 模式的局限性，重点剖析支撑深度代理长时间、复杂任务处理能力的四大关键组件（系统提示、规划工具、子代理、文件系统），并结合 Claude Code ... 登录后查看完整内容

🎬 VideoDeep agents 02

🎬 VideoWhat is a Prompt and Why Does lt Matter?

Prompt 在大语言模型中的定义与角色：作为模型输入指令，直接影响输出方式与结果Prompt 对 AI 行为的引导机制：如何决定模型“回答什么”以及“如何回答”Prompt 清晰度与输出质量之间的关系，对比模糊 Prompt 与结构化 Prompt 的效果差异Prompt 在控... 登录后查看完整内容

🎬 VideoHow to Design an Effective Prompt?

Prompt 设计在 AI 输出质量中的作用，以及 Prompt 结构对准确性与一致性的影响Prompt 过于宽泛与结构清晰之间的输出差异对比通过角色设定（Role Prompting）明确模型视角与回答立场使用约束条件控制输出范围：字数、风格、语气、内容侧重点通过多结果输出设计... 登录后查看完整内容

🎬 VideoPrompt Templates & Parameter Tuning1

Prompt Template 在 AI 应用中的作用：通过模板化 Prompt 提升输出一致性、可复用性与工程可控性Prompt 模板的基本结构设计：明确输入格式、输出预期与上下文约束使用占位符（Placeholders）构建可参数化 Prompt：支持动态内容注入与批量生成常... 登录后查看完整内容

🎬 VideoPrompt Templates & Parameter Tuning 2

Fine-Tuning 在大模型体系中的定位与作用Fine-Tuning 与从零训练（Training from Scratch）的核心区别基于预训练模型进行任务定制化优化的基本思路Fine-Tuning 的标准工作流程：基于已有预训练模型作为起点引入任务相关的领域数据在保留通用... 登录后查看完整内容

🎬 VideoData Generation & Fine-Tuning

使用 AI 生成数据进行模型微调的整体思路与适用场景AI 生成数据在微调中的核心价值：补齐真实业务数据不足的问题减少对大规模人工标注数据的依赖针对特定行业或任务生成高相关性训练样本Prompt 驱动的数据生成方式：通过精心设计的 Prompt 生成结构化、可复用的训练数据控制生成... 登录后查看完整内容

🎬 VideoSelecting the Right Data for Fine-Tuning

微调数据在模型效果中的决定性作用：数据质量直接影响模型稳定性与输出可靠性低质量数据对模型的典型负面影响：性能下降、偏见放大、输出不可控微调数据选择的核心判断标准：数据相关性：是否与目标任务和业务场景高度匹配数据多样性：是否覆盖不同情况，避免单一模式或隐性偏差数据质量：准确性、一致... 登录后查看完整内容

🎬 VideoUnderstanding Model Alignment and Compliance

模型对齐（Model Alignment）的核心目标与边界：模型行为如何与人类价值、业务规则和社会规范保持一致未对齐模型在真实系统中的风险类型：有害内容、偏见输出、误导性回答与合规风险模型对齐在 AI 系统生命周期中的位置：从数据、训练、推理到上线后的持续治理对齐机制的主要实现路... 登录后查看完整内容

🎬 VideoUsing Prompts to Generate Alignment Data

使用 Prompt 生成对齐数据（Alignment Data）的整体思路与作用利用 AI 生成数据来约束和引导模型行为，使输出更贴近人类价值通过 Prompt 设计减少有害、攻击性或不当内容的生成Prompt Engineering 在对齐数据构建中的角色与方法通过结构化 Pr... 登录后查看完整内容

🎬 VideoReal-World Applications of Model Alignment

模型对齐（Model Alignment）在真实业务场景中的应用位置与价值内容审核场景中，通过对齐机制过滤有害、误导性或不当内容偏见检测与公平性控制，减少模型输出中的系统性偏差敏感话题处理机制，对法律、医疗、伦理相关问题进行约束与控制未进行模型对齐时，模型可能产生不安全、不合规或... 登录后查看完整内容

🎬 VideoMethods for Evaluating Data Quality

Prompt 的定义，以及 Prompt 对大模型回答准确性、稳定性和可控性的影响Prompt 不清晰或结构不合理时，模型输出随机性和偏差产生的原因RAG 系统中测试数据在控制幻觉、偏差和错误回答中的作用RAG 测试数据的主要形式：查询-文档对、标准答案数据、边界与对抗样本检索模... 登录后查看完整内容

🎬 VideoTest Data Generationfor RAG: In-DepthEvolution

理解 Prompt 是什么，以及它在 LLM 和 RAG 系统中为什么会直接影响结果质量掌握好 Prompt 与差 Prompt 的核心区别，避免模糊指令导致随机或无效输出认识 Prompt 在生成、评估和微调数据中的作用，不仅是“提问工具”理解 RAG 中测试数据（Test ... 登录后查看完整内容

🧪 LabCustom Synthetic Test Data Generation for RAG Evaluation

学习目标通过本课程的学习，学员将能够：理解合成测试数据在RAG系统评估中的重要性，并掌握合成数据生成的基本技术。学习如何定制化合成数据集，使其符合特定应用场景的需求，模拟实际使用中的复杂输入。掌握评估RAG系统表现的关键指标，结合合成数据分析系统的检索效果和生成质量。深入理解合成... 登录后查看完整内容

ℹ️ InformationSDG Toolkit

学习目标通过本课程的学习，学员将能够：理解合成数据生成的核心概念、类型和适用场景。掌握如何根据业务需求构建符合实际的合成数据集，实现数据的多样化和高质量。学习合成数据在数据隐私保护中的应用，满足数据合规性要求。探索合成数据的评估方法，确保生成数据集在实际应用中保持高效... 登录后查看完整内容

🎬 VideoWhy LLM Fine Tuning

解释什么是模型训练与大模型训练，用直观方式理解“模型、参数、函数”的基本概念从简单数学模型过渡到神经元与神经网络，理解深度学习的基本结构讲清模型训练的核心目标：通过数据和损失函数逼近真实输出介绍梯度下降作为模型训练的基本优化思路，以及学习率的作用对比全量梯度下降、随机梯度下降（S... 登录后查看完整内容

🎬 VideoWhat is model training

用直观、通俗的方式理解什么是模型、模型训练与参数从最简单的函数关系出发，理解模型如何从输入映射到输出认识神经元与神经网络的基本结构（权重、偏置、层的概念）理解模型训练的核心目标：让预测结果尽量接近真实结果了解训练所需的两个关键要素：数据集与损失函数建立“模型训练本质是一个优化问题... 登录后查看完整内容

🎬 VideoWhat is LLM Fine Tuning

认识什么是大模型微调（LLM Fine-Tuning）以及它在大模型训练流程中的位置理解大模型从预训练到可对话模型的完整训练链路区分 Base Model、Instruct Model 和 Chat Model 的差异了解监督微调（SFT）的基本作用与目标认识偏好对齐阶段及常见方... 登录后查看完整内容

🎬 Video大模型微调方法

本节课授课要点讲解大模型从预训练、监督微调（SFT）到偏好对齐的整体训练流程介绍轻量化微调（PEFT）的核心思想与适用场景重点解析 LoRA / QLoRA 的工作原理及参数规模对训练成本的影响对比强化学习微调（RLHF / PPO）的机制与现实工程挑战讲解 DPO（... 登录后查看完整内容

🎬 VideoHow to fine tune LLM

大模型微调的现实前提与运行环境选择大模型微调对硬件、显存和运行环境的实际要求本地运行、Jupyter Notebook 的风险与限制使用 Hugging Face 工具评估模型显存占用与运行可行性Colab、Kaggle、RunPod、云厂商 GPU 环境的对比与适用场景监督微调... 登录后查看完整内容

🎬 Video练习

理解 Fine-Tuning 在真实工程中的位置回顾什么场景适合 Fine-Tuning，什么场景更适合 RAG / Embedding明确 Fine-Tuning 并不是“提升一切能力”，而是对特定任务分布进行对齐熟悉 Hugging Face 生态在微调与评测中的角色使用 H... 登录后查看完整内容

🎬 VideoDownloading Open-Source Model Weights

学习目标- 理解如何从开源平台下载和管理模型权重，掌握处理大规模模型的基本技能- 学习如何确保下载的模型权重能够在不同框架（如TensorFlow、PyTorch）中正确加载和使用- 探索如何通过优化模型权重下载和管理流程，提升开发效率- 提升在实际项目中下载、加载和应用开源模型... 登录后查看完整内容

🎬 VideoLoading LMs on GPU

学习目标- 掌握如何将大型语言模型（LMs）加载到GPU上运行，提升模型推理和训练的速度- 理解GPU与CPU加载模型的性能差异，学习如何优化GPU资源以支持大规模模型- 学习如何在实际项目中管理和优化GPU资源，提高语言模型的性能和效率- 提升在使用GPU进行大规模语言模型推理... 登录后查看完整内容

🎬 Video为什么要使用 Sentence Transformers?

Sentence Transformers 的核心定位理解 Sentence Transformers 在语义搜索、RAG、相似度计算中的角色它如何将文本统一映射到 embedding 空间，用于检索、排序和匹配数据安全与隐私视角下的选择理由RAG 场景中，所有文档都需要先做 e... 登录后查看完整内容

🎬 Video准备工作

完成 Python 开发环境的基础准备讲解为什么在 AI / NLP 项目中推荐使用 Python 虚拟环境，以及在本课程中对 Python 版本的要求，帮助学员建立一个干净、可控的开发环境。熟悉 Python 虚拟环境的创建与激活流程通过示例了解如何使用 venv 创建独立的 ... 登录后查看完整内容

🎬 Video语义检索

语义检索的核心思想本节课介绍语义检索的基本原理：不再依赖关键词匹配，而是将文本（句子、段落或文档）映射到向量空间中，通过向量之间的距离来衡量语义相似度，从而找到“语义上最接近”的内容。查询与文档的向量化过程讲解如何将语料库中的所有文本与用户查询统一转换为向量表示，使查询和文档... 登录后查看完整内容

🎬 VideoRetrieve & Re-Rank-检索和重新排序

检索与重排序的整体流程认知讲清楚在真实搜索系统中，为什么通常采用“两阶段检索”：先用 Retrieval 模型从大规模语料中快速筛选候选结果，再用 Re-Ranker 对候选结果进行精排，从而在效率和准确率之间取得平衡。Bi-Encoder 与 Cross-Encoder 的核... 登录后查看完整内容

🎬 Video聚类(Clustering) : 归类相似的文本

聚类要解决的核心问题与应用场景介绍聚类的基本目标：将语义相似的文本自动归类，用于用户评论归类、新闻热点整理、电商搜索关键词分析等真实业务场景。传统聚类方法的基本思路讲解 k-Means、Agglomerative Clustering 等经典聚类算法的核心思想，以及它们在数值... 登录后查看完整内容

🎬 Video多语言与多模态

多语言语义检索的核心思路讲解如何通过多语言 embedding 模型，实现跨语言的语义搜索能力，让用户可以用不同语言查询同一份内容，而系统仍然能够正确理解语义并返回相关结果。多语言模型的选择与适用场景介绍常见的多语言 Sentence Transformer 模型，以及它们在... 登录后查看完整内容

🎬 Video模型性能

模型性能瓶颈与现实问题背景从大模型参数规模、Embedding 数量、内存占用和推理成本出发，系统解释为什么在真实生产环境中，“模型能跑”远远不够，必须考虑性能、成本与可扩展性。量化（Quantization）在模型优化中的核心作用梳理从 FP32 到 INT8 / Bina... 登录后查看完整内容

🧪 LabProject：Fine-Tuning Embedding Models for RAG using LlamaIndex

学习目标- 掌握如何使用LlamaIndex对嵌入模型进行微调，以优化Retrieval Augmented Generation (RAG)系统中的信息检索和生成任务- 学习如何在RAG系统中利用LlamaIndex微调预训练的Embedding Models，提升检索精度与生... 登录后查看完整内容

ℹ️ InformationEmbedding Fine-Tuning Toolkit

学习目标通过本课程的学习，学员将能够：理解Embedding的基本概念和在NLP及相似性搜索中的应用。学习如何使用预训练Embedding并通过微调优化其在特定任务中的表现。掌握嵌入微调的常用方法和工具，提升模型对特定任务的适应性和准确性。使用合适的数据集和策略进行Embeddi... 登录后查看完整内容

🎬 VideoFine-Tuning Large Language Models

Fine-Tuning 的核心概念课程首先讲清楚什么是 Fine-Tuning：不是重新训练一个模型，而是在已有的预训练大模型基础上，用更小、更聚焦的数据集，让模型在特定领域或任务上表现得更好。从通用模型到领域专家讲解为什么通用大模型虽然能力全面，但在真实业务场景中往往“不够专业... 登录后查看完整内容

🎬 VideoWhy Fine-Tuning?

为什么需要 Fine-Tuning课程首先解释了一个核心问题：通用大模型虽然“什么都会一点”，但在真实业务场景中往往“不够专业、不够贴合”。Fine-Tuning 的目的，就是让模型从“通才”变成“领域专家”，真正解决特定行业或任务的问题。Domain-Specific Adap... 登录后查看完整内容

🎬 VideoTypes of Fine-Tuning

Fine-Tuning 的背景与必要性解释为什么通用大模型在具体业务场景中仍然不够好，以及 Fine-Tuning 在领域适配、任务对齐和用户偏好调整中的作用。Fine-Tuning 的核心应用场景覆盖领域知识迁移、任务性能提升、模型行为与风格定制等典型使用场景，建立对 Fi... 登录后查看完整内容

🎬 VideoLORA (Low-Rank Adaptation)

理解什么是 LLM Fine-Tuning，以及它在 AI 工程中的真实定位本节课程首先讲清楚 Fine-Tuning 并不是“从零训练一个模型”，而是在已有大模型基础上，通过小规模数据让模型更适配特定任务或业务场景，解决通用模型“不够懂你业务”的问题。掌握为什么工程实践中更常... 登录后查看完整内容

🎬 VideoParameter Efficient Fine-Tuning (PEFT)

Fine-Tuning 在 AI 工程中的真实作用课程从工程视角解释什么是 Fine-Tuning，以及它在实际 AI 系统中的位置。不是为了“训练一个新模型”，而是让通用大模型在特定业务场景中更稳定、更准确、更可控地工作。为什么不是所有问题都靠 Prompt 解决对比 Pr... 登录后查看完整内容

🎬 VideoThe “Problem“ with LLMs

理解大模型真正的“性能瓶颈”来自哪里从 LLM 的参数规模出发，理解为什么模型在推理阶段会遇到显著的内存与计算压力，以及为什么“存得下、跑得动”本身就是工程问题，而不只是模型能力问题。认识数值表示方式对模型性能的决定性影响通过 FP32、FP16 等浮点数表示方式的对比，理解... 登录后查看完整内容

🎬 VideoMemory Constraints

什么是 Quantization 量化是一种通过降低数值精度来表示模型参数和计算过程的工程技术，用于在尽量保持模型效果的前提下，减少模型体积并提升推理效率。为什么大模型必须考虑量化随着模型参数规模快速增长，使用高精度浮点数会带来巨大的内存和计算成本，量化是让大模型在现实硬件环境... 登录后查看完整内容

🎬 VideoIntroduction to Quantization

Quantization 的基本定义与目的量化（Quantization）本质上是在模型中降低数值精度的过程，通过把高精度浮点数（如 FP32）转换为低精度表示（如 INT8），在尽量保持模型效果的前提下，显著减少计算和存储成本。为什么量化在工程中非常重要量化直接影响模型的体... 登录后查看完整内容

🎬 VideoTypes of Data Representations in Al

模型量化的工程背景与价值解释为什么 AI 模型在训练阶段通常使用高精度浮点数，而在上线推理阶段需要通过量化来降低计算成本、提升推理速度和资源利用率。AI 中常见的数据表示方式对比 FP32、FP16、BF16 与 INT8 / INT4 等数据表示形式，说明它们在训练、推理和... 登录后查看完整内容

🎬 VideoHow Quantization Works?

了解量化（Quantization）在模型推理中的核心作用本节课首先帮助你建立一个整体认知：为什么在真实 AI 系统中，需要把 FP32 的模型权重和计算过程，转换成 INT8 / INT4。你会理解量化并不是“牺牲模型质量”，而是在可控精度损失下，大幅提升推理速度、降低显存和... 登录后查看完整内容

🎬 VideoAsymmetric Quantization

Asymmetric Quantization（非对称量化），以及它与 Symmetric Quantization 的核心区别，重点理解为什么在真实模型中，数值分布往往并不以 0 为中心。通过可视化示意图，解释浮点数范围（FP32）如何映射到 INT8 的离散区间，重点理解 z... 登录后查看完整内容

🎬 VideoModel Quantization in Practice

讲解模型量化在真实 AI 项目中的作用，帮助你理解为什么在生产环境中需要对模型进行量化处理，而不仅停留在实验或理论阶段。通过一个完整的量化项目实战，系统展示从模型训练、量化处理到推理性能调优的完整工程流程，理解量化在效果、性能和资源消耗之间的取舍。结合多个实际应用场景，分析量化技... 登录后查看完整内容

🧪 LabProject：Fine-Tuning Llama 3.1 with PEFT-QLoRA

学习目标通过本课程的学习，学员将能够：理解Llama 3.1模型的基础结构和应用场景。学习PEFT（Parameter-Efficient Fine-Tuning）和QLoRA（Quantized Low-Rank Adaptation）的核心概念和工作原理。掌握在低资源环境中应... 登录后查看完整内容

🎬 VideoLinkedin & CV 2024.12.08

Linkedin & CV 2024.12.08

AI Engineer核心技术实战课

课程大纲