活动介绍

LLM From Scratch：60 分钟用代码拆解大模型的每一层

Name: LLM从零开始：60分钟解码大模型每一层
Start: 2026-06-08T09:00:00.000Z
End: 2026-06-08T10:00:00.000Z

一个让人睡不着的问题

你每天都在用 ChatGPT、Claude、Gemini。

你问它问题，它回答。你让它写代码，它写出来。你让它扮演一个角色，它演得活灵活现。

但你有没有在某个深夜，盯着屏幕上那行刚生成出来的文字，突然想过——

它到底是怎么"知道"下一个字该写什么的？

不是 prompt 工程那种"怎么用得更好"。不是 RAG / Agent 那种"怎么搭得更强"。是更底层的那个问题：这台机器，到底是怎么造出来的？

如果你也想过这个问题，并且不满足于"它就是个概率模型"这种敷衍的答案——这场课就是为你准备的。

这场课不是科普

市面上 90% 的"大模型公开课"都在做同一件事：把一个复杂的东西，讲得让所有人都能听懂。

我们这场反着来。

我们不会从"什么是人工智能"开始讲。不会用"大模型就像一个超级大脑"这种比喻糊弄你。不会在该上代码的时候给你看示意图。

这场课只做一件事：用 60 分钟，把大模型这个黑盒子拆开，让你看见里面的每一个齿轮。

如果你看完之后，能在心里给"Transformer 到底在算什么"画出一张图——这场课就值了。

60 分钟会讲什么

▎ 大模型训练的阶段 从原始数据到一个能说话的模型，中间到底经过了什么？

▎ 大模型是如何工作的

一个人读完 30 万遍《哈利波特》需要 30 万年。一个大模型"读完"同样的量，只需要几周。这不是因为机器快。是因为它根本不是在"读书"。

那它在做的，到底是什么？

▎ Transformer——大模型的心脏 整个 LLM 如果只能讲一件事，那只能是 Transformer。为什么是它？Attention 在算什么？一层一层拆开。

▎ Demo：从零写一个 LLM 纯代码演示。不是 Cursor，不是 Copilot，是真正意义上的 from scratch。

关于讲师 Julie

讲技术的人很多。能把技术讲清楚的人不多。能把技术讲清楚、又自己在一线把技术做出来的人，更少。

Julie 老师属于最后一种。

🎓 学术背景

电子科技大学（985/211）电子科学与技术，本科 + 全日制硕士七年科班训练。

💼 二十年技术沉淀

思科（Cisco）10 年＋ Global Support 经验——这是一份需要在全球范围内解决最复杂技术问题的工作。CCIE 安全认证、CCIE 网络认证双认证（CCIE 是网络工程师领域公认最难拿的认证之一）。

🏆 三届思科 AI 内部大赛 Site 第一名

这部分尤其值得说——因为这些不是"参加了一下"，是真刀真枪在思科内部和工程师同台竞技拿下来的：

2025｜RAG for Cisco IP Phone｜Hackzone 大赛 Site 第一名把 RAG 技术真正落地到思科 IP 电话这个真实业务场景里

2025｜AI Agent for Customer Support｜TechZone 大赛 Site 第一名用 AI Agent 解决思科客服的真实业务问题

2026｜Poisoning LLM to Output "Cisco IP Phone is the Best Phone"｜Playtime 大赛 Site 第一名做 LLM 的对抗攻击研究——这是只有真正懂底层的人才能做的事

🎥 5000＋ B 站粉丝的 AI 技术 UP 主

独立规划制作 AI 书籍配套教学视频，累计超过 100 小时，覆盖 LLM 基础、微调、AI Agent、RAG 等核心方向。

一个能把 Transformer 讲清楚的人很多。一个能把 Transformer 讲清楚、还能在思科真实业务里用 RAG 和 Agent 拿三个第一的人—— 大概率全网就这一个。

这场课适合谁

✓ 适合

有 Python 基础，了解基本深度学习概念（知道什么是梯度下降、神经网络）

已经在用 LLM（ChatGPT / Claude / API 都行），但想知道它内部到底是怎么转的

想读懂、修改、甚至自己实现 LLM 代码的工程师

不满足于"会用"，想搞清楚"为什么这么用"的人

名校毕业、IT / 算法背景，对"虚的科普"过敏的人

✗ 不适合

想学 prompt 工程或 AI 应用落地的同学（这场课不讲这个）

完全没接触过编程的同学（这场课会涉及代码）

期待"听完就能赚钱"的同学（这是技术深潜，不是变现课）

我们想得很清楚： 宁可只来 100 个对的人，不要来 1000 个走错教室的人。

你会带走什么

不会承诺听完就能做出 ChatGPT——那是骗人。

但听完之后，你的"看世界的方式"会变一点点：

再看一个 LLM 输出的时候，你会知道它背后那个 forward pass 在算什么

再读到一篇大模型论文的时候，你会知道作者在改的是哪一层

再用 ChatGPT / Claude 的时候，你会对它的能力边界心里有数

如果你以后想自己跑模型、微调模型、读源码——这 60 分钟会是一个结实的起点

60 分钟。一个把大模型拆开的机会。我们直播间见。

LLM From Scratch：60 分钟用代码拆解大模型的每一层

一个让人睡不着的问题

你每天都在用 ChatGPT、Claude、Gemini。

你问它问题，它回答。你让它写代码，它写出来。你让它扮演一个角色，它演得活灵活现。

但你有没有在某个深夜，盯着屏幕上那行刚生成出来的文字，突然想过——

它到底是怎么"知道"下一个字该写什么的？

不是 prompt 工程那种"怎么用得更好"。不是 RAG / Agent 那种"怎么搭得更强"。是更底层的那个问题：这台机器，到底是怎么造出来的？

如果你也想过这个问题，并且不满足于"它就是个概率模型"这种敷衍的答案——这场课就是为你准备的。

这场课不是科普

市面上 90% 的"大模型公开课"都在做同一件事：把一个复杂的东西，讲得让所有人都能听懂。

我们这场反着来。

我们不会从"什么是人工智能"开始讲。不会用"大模型就像一个超级大脑"这种比喻糊弄你。不会在该上代码的时候给你看示意图。

这场课只做一件事：用 60 分钟，把大模型这个黑盒子拆开，让你看见里面的每一个齿轮。

如果你看完之后，能在心里给"Transformer 到底在算什么"画出一张图——这场课就值了。

60 分钟会讲什么

▎ 大模型训练的阶段 从原始数据到一个能说话的模型，中间到底经过了什么？

▎ 大模型是如何工作的

一个人读完 30 万遍《哈利波特》需要 30 万年。一个大模型"读完"同样的量，只需要几周。这不是因为机器快。是因为它根本不是在"读书"。

那它在做的，到底是什么？

▎ Transformer——大模型的心脏 整个 LLM 如果只能讲一件事，那只能是 Transformer。为什么是它？Attention 在算什么？一层一层拆开。

▎ Demo：从零写一个 LLM 纯代码演示。不是 Cursor，不是 Copilot，是真正意义上的 from scratch。

关于讲师 Julie

讲技术的人很多。能把技术讲清楚的人不多。能把技术讲清楚、又自己在一线把技术做出来的人，更少。

Julie 老师属于最后一种。

🎓 学术背景

电子科技大学（985/211）电子科学与技术，本科 + 全日制硕士七年科班训练。

💼 二十年技术沉淀

🏆 三届思科 AI 内部大赛 Site 第一名

这部分尤其值得说——因为这些不是"参加了一下"，是真刀真枪在思科内部和工程师同台竞技拿下来的：

2025｜RAG for Cisco IP Phone｜Hackzone 大赛 Site 第一名把 RAG 技术真正落地到思科 IP 电话这个真实业务场景里

2025｜AI Agent for Customer Support｜TechZone 大赛 Site 第一名用 AI Agent 解决思科客服的真实业务问题

2026｜Poisoning LLM to Output "Cisco IP Phone is the Best Phone"｜Playtime 大赛 Site 第一名做 LLM 的对抗攻击研究——这是只有真正懂底层的人才能做的事

🎥 5000＋ B 站粉丝的 AI 技术 UP 主

独立规划制作 AI 书籍配套教学视频，累计超过 100 小时，覆盖 LLM 基础、微调、AI Agent、RAG 等核心方向。

一个能把 Transformer 讲清楚的人很多。一个能把 Transformer 讲清楚、还能在思科真实业务里用 RAG 和 Agent 拿三个第一的人—— 大概率全网就这一个。

这场课适合谁

✓ 适合

有 Python 基础，了解基本深度学习概念（知道什么是梯度下降、神经网络）

已经在用 LLM（ChatGPT / Claude / API 都行），但想知道它内部到底是怎么转的

想读懂、修改、甚至自己实现 LLM 代码的工程师

不满足于"会用"，想搞清楚"为什么这么用"的人

名校毕业、IT / 算法背景，对"虚的科普"过敏的人

✗ 不适合

想学 prompt 工程或 AI 应用落地的同学（这场课不讲这个）

完全没接触过编程的同学（这场课会涉及代码）

期待"听完就能赚钱"的同学（这是技术深潜，不是变现课）

我们想得很清楚： 宁可只来 100 个对的人，不要来 1000 个走错教室的人。

你会带走什么

不会承诺听完就能做出 ChatGPT——那是骗人。

但听完之后，你的"看世界的方式"会变一点点：

再看一个 LLM 输出的时候，你会知道它背后那个 forward pass 在算什么

再读到一篇大模型论文的时候，你会知道作者在改的是哪一层

再用 ChatGPT / Claude 的时候，你会对它的能力边界心里有数

如果你以后想自己跑模型、微调模型、读源码——这 60 分钟会是一个结实的起点

60 分钟。一个把大模型拆开的机会。我们直播间见。

LLM From Scratch：60 分钟用代码拆解大模型的每一层

活动介绍

LLM From Scratch：60 分钟用代码拆解大模型的每一层

一个让人睡不着的问题

这场课不是科普

60 分钟会讲什么

关于讲师 Julie

这场课适合谁

你会带走什么

活动嘉宾

活动讨论

LLM From Scratch：60 分钟用代码拆解大模型的每一层

LLM From Scratch：60 分钟用代码拆解大模型的每一层

一个让人睡不着的问题

这场课不是科普

60 分钟会讲什么

关于讲师 Julie

这场课适合谁

你会带走什么

适合谁学习

活动嘉宾

订阅活动更新

活动信息

已报名参与 (43)

快捷操作

活动保障

活动发起方

关注我们

继续看 AI 活动

Partnership