logo

Introduction to Large Language Models (LLM 导论)

Source: Google Cloud "Introduction to Large Language Models" Course Level: Beginner (入门级) Estimated Time: 15 mins

什么是 Large Language Models (LLMs)?

Large Language Models (LLMs) 是 Generative AI 的一个重要分支,专门处理人类语言。简单来说,LLMs 是在海量文本上训练的大型深度学习模型。

为什么叫 "Large"?

  1. Dataset Size: 它们读过几乎整个互联网的公开文本(书籍、论文、代码、对话等)。
  2. Parameters: 模型内部拥有数亿甚至数万亿个参数。参数越多,模型捕捉语言复杂规律的能力就越强。

LLM 的核心能力

一个优秀的 LLM 通常具备以下几种能力:

  • Natural Language Understanding (NLU): 理解你的意图,而不仅仅是匹配关键词。
  • Text Generation: 生成流畅、连贯的回复。
  • Summarization: 把冗长的 article 变成精简的 summary。
  • Translation: 在几百种语言之间进行高质量转换。
  • Reasoning: 处理逻辑推理、数学问题和 coding 任务。

预训练与微调 (Pre-training vs. Fine-tuning)

LLM 的生命周期通常分为两个阶段:

  1. Pre-training: 这是最费钱、最耗算力的阶段。模型在通用数据上学习语言的一般规律。此时它是一个“通才”,但可能在专业领域表现一般。
  2. Fine-tuning: 在特定领域的 dataset 上进一步训练模型(比如医学、法律或特定公司的文档)。这能让模型变成某个领域的“专才”。

什么是 Prompt Tuning?

现在我们有了更高效的方法:Prompt Tuning。 你不需要重新训练模型的参数,而是通过设计精妙的 System Prompt 或提供 Few-shot examples,引导模型按照你的要求输出。这比传统的 Fine-tuning 更快、成本更低。


使用场景 (Use Cases)

  • Customer Support: 构建能 24/7 handle 客户咨询的 Agent。
  • Content Creation: 帮你写 email, blog posts 或 social media captions。
  • Code Assistant: 辅助程序员写 code、找 bug (比如 GitHub Copilot 或 Gemini Code Assist)。
  • Knowledge Management: 快速搜索和总结公司内部的庞大文档库。

Google 的 LLM 生态:Vertex AI

如果你是开发者,Google 推荐使用 Vertex AI 平台。它集成了 Google 最强大的模型(如 Gemini 系列),并提供了 Model Garden 让你可以轻松调用、测试和部署各种模型。

Key Takeaway: LLM 不是搜索引擎,它不存储信息,它只是通过学到的规律在“预测”下一个词。理解这一点,能帮你更好地设计 Prompt。

Google AI Essentials
AI Engineer

Google AI Essentials

An English entry point to JR Academy curated Google AI learning materials and practical references.

Google AI EssentialsIntroduction to LLMs

Introduction to Large Language Models (LLM 导论)

Source: Google Cloud "Introduction to Large Language Models" Course Level: Beginner (入门级) Estimated Time: 15 mins

#什么是 Large Language Models (LLMs)?

Large Language Models (LLMs) 是 Generative AI 的一个重要分支,专门处理人类语言。简单来说,LLMs 是在海量文本上训练的大型深度学习模型。

#为什么叫 "Large"?

  1. Dataset Size: 它们读过几乎整个互联网的公开文本(书籍、论文、代码、对话等)。
  2. Parameters: 模型内部拥有数亿甚至数万亿个参数。参数越多,模型捕捉语言复杂规律的能力就越强。

#LLM 的核心能力

一个优秀的 LLM 通常具备以下几种能力:

  • Natural Language Understanding (NLU): 理解你的意图,而不仅仅是匹配关键词。
  • Text Generation: 生成流畅、连贯的回复。
  • Summarization: 把冗长的 article 变成精简的 summary。
  • Translation: 在几百种语言之间进行高质量转换。
  • Reasoning: 处理逻辑推理、数学问题和 coding 任务。

#预训练与微调 (Pre-training vs. Fine-tuning)

LLM 的生命周期通常分为两个阶段:

  1. Pre-training: 这是最费钱、最耗算力的阶段。模型在通用数据上学习语言的一般规律。此时它是一个“通才”,但可能在专业领域表现一般。
  2. Fine-tuning: 在特定领域的 dataset 上进一步训练模型(比如医学、法律或特定公司的文档)。这能让模型变成某个领域的“专才”。

#什么是 Prompt Tuning?

现在我们有了更高效的方法:Prompt Tuning。 你不需要重新训练模型的参数,而是通过设计精妙的 System Prompt 或提供 Few-shot examples,引导模型按照你的要求输出。这比传统的 Fine-tuning 更快、成本更低。


#使用场景 (Use Cases)

  • Customer Support: 构建能 24/7 handle 客户咨询的 Agent。
  • Content Creation: 帮你写 email, blog posts 或 social media captions。
  • Code Assistant: 辅助程序员写 code、找 bug (比如 GitHub Copilot 或 Gemini Code Assist)。
  • Knowledge Management: 快速搜索和总结公司内部的庞大文档库。

#Google 的 LLM 生态:Vertex AI

如果你是开发者,Google 推荐使用 Vertex AI 平台。它集成了 Google 最强大的模型(如 Gemini 系列),并提供了 Model Garden 让你可以轻松调用、测试和部署各种模型。

Key Takeaway: LLM 不是搜索引擎,它不存储信息,它只是通过学到的规律在“预测”下一个词。理解这一点,能帮你更好地设计 Prompt。