LLM From Scratch:60 分钟用代码拆解大模型的每一层

LLM From Scratch:60 分钟用代码拆解大模型的每一层

匠人
主办方: 匠人学院

活动介绍

LLM From Scratch:60 分钟用代码拆解大模型的每一层

一个让人睡不着的问题

你每天都在用 ChatGPT、Claude、Gemini。
你问它问题,它回答。 你让它写代码,它写出来。 你让它扮演一个角色,它演得活灵活现。
但你有没有在某个深夜,盯着屏幕上那行刚生成出来的文字,突然想过——
它到底是怎么"知道"下一个字该写什么的?
不是 prompt 工程那种"怎么用得更好"。 不是 RAG / Agent 那种"怎么搭得更强"。 是更底层的那个问题:这台机器,到底是怎么造出来的?
如果你也想过这个问题,并且不满足于"它就是个概率模型"这种敷衍的答案——这场课就是为你准备的。

这场课不是科普

市面上 90% 的"大模型公开课"都在做同一件事:把一个复杂的东西,讲得让所有人都能听懂
我们这场反着来。
我们不会从"什么是人工智能"开始讲。 不会用"大模型就像一个超级大脑"这种比喻糊弄你。 不会在该上代码的时候给你看示意图。
这场课只做一件事:用 60 分钟,把大模型这个黑盒子拆开,让你看见里面的每一个齿轮。
如果你看完之后,能在心里给"Transformer 到底在算什么"画出一张图——这场课就值了。

60 分钟会讲什么

▎ 大模型训练的阶段 从原始数据到一个能说话的模型,中间到底经过了什么?
▎ 大模型是如何工作的
一个人读完 30 万遍《哈利波特》需要 30 万年。 一个大模型"读完"同样的量,只需要几周。 这不是因为机器快。是因为它根本不是在"读书"。
那它在做的,到底是什么?
▎ Transformer——大模型的心脏 整个 LLM 如果只能讲一件事,那只能是 Transformer。 为什么是它?Attention 在算什么?一层一层拆开。
▎ Demo:从零写一个 LLM 纯代码演示。 不是 Cursor,不是 Copilot,是真正意义上的 from scratch

关于讲师 Julie

讲技术的人很多。能把技术讲清楚的人不多。能把技术讲清楚、又自己在一线把技术做出来的人,更少。
Julie 老师属于最后一种。
🎓 学术背景
电子科技大学(985/211)电子科学与技术,本科 + 全日制硕士七年科班训练。
💼 二十年技术沉淀
思科(Cisco)10 年+ Global Support 经验——这是一份需要在全球范围内解决最复杂技术问题的工作。CCIE 安全认证、CCIE 网络认证双认证(CCIE 是网络工程师领域公认最难拿的认证之一)。
🏆 三届思科 AI 内部大赛 Site 第一名
这部分尤其值得说——因为这些不是"参加了一下",是真刀真枪在思科内部和工程师同台竞技拿下来的:
  • 2025|RAG for Cisco IP Phone|Hackzone 大赛 Site 第一名 把 RAG 技术真正落地到思科 IP 电话这个真实业务场景里
  • 2025|AI Agent for Customer Support|TechZone 大赛 Site 第一名 用 AI Agent 解决思科客服的真实业务问题
  • 2026|Poisoning LLM to Output "Cisco IP Phone is the Best Phone"|Playtime 大赛 Site 第一名 做 LLM 的对抗攻击研究——这是只有真正懂底层的人才能做的事
🎥 5000+ B 站粉丝的 AI 技术 UP 主
独立规划制作 AI 书籍配套教学视频,累计超过 100 小时,覆盖 LLM 基础、微调、AI Agent、RAG 等核心方向。
一个能把 Transformer 讲清楚的人很多。 一个能把 Transformer 讲清楚、还能在思科真实业务里用 RAG 和 Agent 拿三个第一的人—— 大概率全网就这一个。

这场课适合谁

✓ 适合
  • 有 Python 基础,了解基本深度学习概念(知道什么是梯度下降、神经网络)
  • 已经在用 LLM(ChatGPT / Claude / API 都行),但想知道它内部到底是怎么转的
  • 想读懂、修改、甚至自己实现 LLM 代码的工程师
  • 不满足于"会用",想搞清楚"为什么这么用"的人
  • 名校毕业、IT / 算法背景,对"虚的科普"过敏的人
✗ 不适合
  • 想学 prompt 工程AI 应用落地的同学(这场课不讲这个)
  • 完全没接触过编程的同学(这场课会涉及代码)
  • 期待"听完就能赚钱"的同学(这是技术深潜,不是变现课)
我们想得很清楚: 宁可只来 100 个对的人,不要来 1000 个走错教室的人。

你会带走什么

不会承诺听完就能做出 ChatGPT——那是骗人。
但听完之后,你的"看世界的方式"会变一点点
  • 再看一个 LLM 输出的时候,你会知道它背后那个 forward pass 在算什么
  • 再读到一篇大模型论文的时候,你会知道作者在改的是哪一层
  • 再用 ChatGPT / Claude 的时候,你会对它的能力边界心里有数
  • 如果你以后想自己跑模型、微调模型、读源码——这 60 分钟会是一个结实的起点
60 分钟。 一个把大模型拆开的机会。 我们直播间见。
 

活动讨论

LLM From Scratch:60 分钟用代码拆解大模型的每一层
线上活动讲座meetup

LLM From Scratch:60 分钟用代码拆解大模型的每一层

2026年6月8日 (周)09:00 - 10:00 AEST
线上参与
0 / 50已报名

LLM From Scratch:60 分钟用代码拆解大模型的每一层

一个让人睡不着的问题

你每天都在用 ChatGPT、Claude、Gemini。
你问它问题,它回答。 你让它写代码,它写出来。 你让它扮演一个角色,它演得活灵活现。
但你有没有在某个深夜,盯着屏幕上那行刚生成出来的文字,突然想过——
它到底是怎么"知道"下一个字该写什么的?
不是 prompt 工程那种"怎么用得更好"。 不是 RAG / Agent 那种"怎么搭得更强"。 是更底层的那个问题:这台机器,到底是怎么造出来的?
如果你也想过这个问题,并且不满足于"它就是个概率模型"这种敷衍的答案——这场课就是为你准备的。

这场课不是科普

市面上 90% 的"大模型公开课"都在做同一件事:把一个复杂的东西,讲得让所有人都能听懂
我们这场反着来。
我们不会从"什么是人工智能"开始讲。 不会用"大模型就像一个超级大脑"这种比喻糊弄你。 不会在该上代码的时候给你看示意图。
这场课只做一件事:用 60 分钟,把大模型这个黑盒子拆开,让你看见里面的每一个齿轮。
如果你看完之后,能在心里给"Transformer 到底在算什么"画出一张图——这场课就值了。

60 分钟会讲什么

▎ 大模型训练的阶段 从原始数据到一个能说话的模型,中间到底经过了什么?
▎ 大模型是如何工作的
一个人读完 30 万遍《哈利波特》需要 30 万年。 一个大模型"读完"同样的量,只需要几周。 这不是因为机器快。是因为它根本不是在"读书"。
那它在做的,到底是什么?
▎ Transformer——大模型的心脏 整个 LLM 如果只能讲一件事,那只能是 Transformer。 为什么是它?Attention 在算什么?一层一层拆开。
▎ Demo:从零写一个 LLM 纯代码演示。 不是 Cursor,不是 Copilot,是真正意义上的 from scratch

关于讲师 Julie

讲技术的人很多。能把技术讲清楚的人不多。能把技术讲清楚、又自己在一线把技术做出来的人,更少。
Julie 老师属于最后一种。
🎓 学术背景
电子科技大学(985/211)电子科学与技术,本科 + 全日制硕士七年科班训练。
💼 二十年技术沉淀
思科(Cisco)10 年+ Global Support 经验——这是一份需要在全球范围内解决最复杂技术问题的工作。CCIE 安全认证、CCIE 网络认证双认证(CCIE 是网络工程师领域公认最难拿的认证之一)。
🏆 三届思科 AI 内部大赛 Site 第一名
这部分尤其值得说——因为这些不是"参加了一下",是真刀真枪在思科内部和工程师同台竞技拿下来的:
  • 2025|RAG for Cisco IP Phone|Hackzone 大赛 Site 第一名 把 RAG 技术真正落地到思科 IP 电话这个真实业务场景里
  • 2025|AI Agent for Customer Support|TechZone 大赛 Site 第一名 用 AI Agent 解决思科客服的真实业务问题
  • 2026|Poisoning LLM to Output "Cisco IP Phone is the Best Phone"|Playtime 大赛 Site 第一名 做 LLM 的对抗攻击研究——这是只有真正懂底层的人才能做的事
🎥 5000+ B 站粉丝的 AI 技术 UP 主
独立规划制作 AI 书籍配套教学视频,累计超过 100 小时,覆盖 LLM 基础、微调、AI Agent、RAG 等核心方向。
一个能把 Transformer 讲清楚的人很多。 一个能把 Transformer 讲清楚、还能在思科真实业务里用 RAG 和 Agent 拿三个第一的人—— 大概率全网就这一个。

这场课适合谁

✓ 适合
  • 有 Python 基础,了解基本深度学习概念(知道什么是梯度下降、神经网络)
  • 已经在用 LLM(ChatGPT / Claude / API 都行),但想知道它内部到底是怎么转的
  • 想读懂、修改、甚至自己实现 LLM 代码的工程师
  • 不满足于"会用",想搞清楚"为什么这么用"的人
  • 名校毕业、IT / 算法背景,对"虚的科普"过敏的人
✗ 不适合
  • 想学 prompt 工程AI 应用落地的同学(这场课不讲这个)
  • 完全没接触过编程的同学(这场课会涉及代码)
  • 期待"听完就能赚钱"的同学(这是技术深潜,不是变现课)
我们想得很清楚: 宁可只来 100 个对的人,不要来 1000 个走错教室的人。

你会带走什么

不会承诺听完就能做出 ChatGPT——那是骗人。
但听完之后,你的"看世界的方式"会变一点点
  • 再看一个 LLM 输出的时候,你会知道它背后那个 forward pass 在算什么
  • 再读到一篇大模型论文的时候,你会知道作者在改的是哪一层
  • 再用 ChatGPT / Claude 的时候,你会对它的能力边界心里有数
  • 如果你以后想自己跑模型、微调模型、读源码——这 60 分钟会是一个结实的起点
60 分钟。 一个把大模型拆开的机会。 我们直播间见。
 

适合谁学习

💼
求职与转行人士
希望进入科技行业或寻找新机会的职场人
🎓
在读学生
想了解行业动态、拓展人脉的大学生及应届毕业生
🚀
技术从业者
希望持续成长、与同行交流的开发者和工程师
加入 JR Academy 技术社群
与数千名澳洲 IT 从业者一起学习、交流、共同成长
立即加入社群

订阅活动更新

获取最新 AI 活动 / Workshop / Meetup 通知,邮箱可随时退订。

免费
免费活动
0 / 50 人已报名0%
👑 开通会员享更多权益 →
活动时间06月08日 (Mon) 09:00
活动地点线上活动
剩余名额50 / 50
活动类型线上活动
或者

活动信息

活动类型
线上活动
活动费用
免费

已报名参与 (0)

暂无报名记录,第一个加入吧

快捷操作

活动保障

检票入场,实名核验
真实讲师,现场授课
活动结束后可评分反馈
开放问答互动环节

活动发起方

JR
JR Academy
澳洲 IT 职业培训机构

更多活动

添加日历

Partnership

我们很自豪能够与一些全球最具影响力的科技和商业公司建立合作。这些合作伙伴关系展现了我们对卓越与创新的承诺,并为我们的学员提供了接触Professional Networking, 真实项目, 实习机会, 就业机会以及前沿技术的宝贵机会。

Atlassian - 匠人学院合作企业Canva - 匠人学院合作企业Amazon - 匠人学院合作企业Deloitte - 匠人学院合作企业