🎬 VideoWhy LLM Fine Tuning
解释什么是模型训练与大模型训练,用直观方式理解“模型、参数、函数”的基本概念从简单数学模型过渡到神经元与神经网络,理解深度学习的基本结构讲清模型训练的核心目标:通过数据和损失函数逼近真实输出介绍梯度下降作为模型训练的基本优化思路,以及学习率的作用对比全量梯度下降、随机梯度下降(S... 登录后查看完整内容
🎬 VideoWhat is model training
用直观、通俗的方式理解什么是模型、模型训练与参数从最简单的函数关系出发,理解模型如何从输入映射到输出认识神经元与神经网络的基本结构(权重、偏置、层的概念)理解模型训练的核心目标:让预测结果尽量接近真实结果了解训练所需的两个关键要素:数据集与损失函数建立“模型训练本质是一个优化问题... 登录后查看完整内容
🎬 VideoWhat is LLM Fine Tuning
认识什么是大模型微调(LLM Fine-Tuning)以及它在大模型训练流程中的位置理解大模型从预训练到可对话模型的完整训练链路区分 Base Model、Instruct Model 和 Chat Model 的差异了解监督微调(SFT)的基本作用与目标认识偏好对齐阶段及常见方... 登录后查看完整内容
🎬 Video大模型微调方法
本节课授课要点讲解大模型从 预训练、监督微调(SFT)到偏好对齐 的整体训练流程介绍 轻量化微调(PEFT) 的核心思想与适用场景重点解析 LoRA / QLoRA 的工作原理及参数规模对训练成本的影响对比 强化学习微调(RLHF / PPO) 的机制与现实工程挑战讲解 DPO(... 登录后查看完整内容
🎬 VideoHow to fine tune LLM
大模型微调的现实前提与运行环境选择大模型微调对硬件、显存和运行环境的实际要求本地运行、Jupyter Notebook 的风险与限制使用 Hugging Face 工具评估模型显存占用与运行可行性Colab、Kaggle、RunPod、云厂商 GPU 环境的对比与适用场景监督微调... 登录后查看完整内容
🎬 Video练习
理解 Fine-Tuning 在真实工程中的位置回顾什么场景适合 Fine-Tuning,什么场景更适合 RAG / Embedding明确 Fine-Tuning 并不是“提升一切能力”,而是对特定任务分布进行对齐熟悉 Hugging Face 生态在微调与评测中的角色使用 H... 登录后查看完整内容
🎬 VideoDownloading Open-Source Model Weights
学习目标- 理解如何从开源平台下载和管理模型权重,掌握处理大规模模型的基本技能- 学习如何确保下载的模型权重能够在不同框架(如TensorFlow、PyTorch)中正确加载和使用- 探索如何通过优化模型权重下载和管理流程,提升开发效率- 提升在实际项目中下载、加载和应用开源模型... 登录后查看完整内容
🎬 VideoLoading LMs on GPU
学习目标- 掌握如何将大型语言模型(LMs)加载到GPU上运行,提升模型推理和训练的速度- 理解GPU与CPU加载模型的性能差异,学习如何优化GPU资源以支持大规模模型- 学习如何在实际项目中管理和优化GPU资源,提高语言模型的性能和效率- 提升在使用GPU进行大规模语言模型推理... 登录后查看完整内容
🎬 Video为什么要使用 Sentence Transformers?
Sentence Transformers 的核心定位理解 Sentence Transformers 在语义搜索、RAG、相似度计算中的角色它如何将文本统一映射到 embedding 空间,用于检索、排序和匹配数据安全与隐私视角下的选择理由RAG 场景中,所有文档都需要先做 e... 登录后查看完整内容
🎬 Video准备工作
完成 Python 开发环境的基础准备讲解为什么在 AI / NLP 项目中推荐使用 Python 虚拟环境,以及在本课程中对 Python 版本的要求,帮助学员建立一个干净、可控的开发环境。熟悉 Python 虚拟环境的创建与激活流程通过示例了解如何使用 venv 创建独立的 ... 登录后查看完整内容
🎬 Video语义检索
语义检索的核心思想 本节课介绍语义检索的基本原理:不再依赖关键词匹配,而是将文本(句子、段落或文档)映射到向量空间中,通过向量之间的距离来衡量语义相似度,从而找到“语义上最接近”的内容。查询与文档的向量化过程 讲解如何将语料库中的所有文本与用户查询统一转换为向量表示,使查询和文档... 登录后查看完整内容
🎬 VideoRetrieve & Re-Rank-检索和重新排序
检索与重排序的整体流程认知 讲清楚在真实搜索系统中,为什么通常采用“两阶段检索”:先用 Retrieval 模型从大规模语料中快速筛选候选结果,再用 Re-Ranker 对候选结果进行精排,从而在效率和准确率之间取得平衡。Bi-Encoder 与 Cross-Encoder 的核... 登录后查看完整内容
🎬 Video聚类(Clustering) : 归类相似的文本
聚类要解决的核心问题与应用场景 介绍聚类的基本目标:将语义相似的文本自动归类,用于用户评论归类、新闻热点整理、电商搜索关键词分析等真实业务场景。传统聚类方法的基本思路 讲解 k-Means、Agglomerative Clustering 等经典聚类算法的核心思想,以及它们在数值... 登录后查看完整内容
🎬 Video多语言与多模态
多语言语义检索的核心思路 讲解如何通过多语言 embedding 模型,实现跨语言的语义搜索能力,让用户可以用不同语言查询同一份内容,而系统仍然能够正确理解语义并返回相关结果。多语言模型的选择与适用场景 介绍常见的多语言 Sentence Transformer 模型,以及它们在... 登录后查看完整内容
🎬 Video模型性能
模型性能瓶颈与现实问题背景 从大模型参数规模、Embedding 数量、内存占用和推理成本出发,系统解释为什么在真实生产环境中,“模型能跑”远远不够,必须考虑性能、成本与可扩展性。量化(Quantization)在模型优化中的核心作用 梳理从 FP32 到 INT8 / Bina... 登录后查看完整内容
🧪 LabProject:Fine-Tuning Embedding Models for RAG using LlamaIndex
学习目标- 掌握如何使用LlamaIndex对嵌入模型进行微调,以优化Retrieval Augmented Generation (RAG)系统中的信息检索和生成任务- 学习如何在RAG系统中利用LlamaIndex微调预训练的Embedding Models,提升检索精度与生... 登录后查看完整内容