logo

Introduction to Generative AI (生成式 AI 导论)

Source: Google Cloud "Introduction to Generative AI" Course Level: Beginner (入门级) Estimated Time: 15 mins

什么是 Generative AI?

Generative AI (简称 Gen AI) 是一种能够创建新内容的 AI 技术。不同于传统的 AI 只是分析现有的数据,Gen AI 可以根据它学到的 patterns 来 generate 全新的 text, images, audio, 甚至是 code。

AI, ML, Deep Learning 与 Gen AI 的关系

为了搞清楚 Gen AI 在哪里,我们可以看这个层级关系:

AI Hierarchy

  1. Artificial Intelligence (AI): 最广泛的概念,指机器模拟人类智能。
  2. Machine Learning (ML): AI 的一个子集,通过数据来让机器学习,而不是显式编程。
  3. Deep Learning: ML 的一个子集,使用神经网络 (Neural Networks) 处理更复杂的任务。
  4. Generative AI: Deep Learning 的一个子集,专注于 create new content

一句话总结:传统的 ML 擅长 Predict (预测),而 Gen AI 擅长 Create (创造)。


Gen AI 是怎么工作的?

Gen AI 依赖于 Foundation Models。这些模型在庞大的 dataset 上进行训练,学习数据背后的统计规律。当你给模型一个 Prompt (提示词) 时,它会根据概率预测下一个最合适的 element (比如下一个词或下一个像素),从而拼凑出完整的内容。

Discriminative vs. Generative Models

Generative vs Discriminative

  • Discriminative Models (判别模型): 它们学习的是数据之间的边界。比如给一张照片,它能判断这是“猫”还是“狗”。
  • Generative Models (生成模型): 它们学习的是数据的分布。比如它可以根据学到的“猫”的特征,自己画出一只全新的“猫”。

核心概念:Large Language Models (LLMs)

我们最常用的 ChatGPT, Claude, Gemini 都属于 Large Language Models

  • Large: 指的是它们在海量的文本数据上训练,并且拥有巨大的参数量。
  • Language: 指的是它们的主要任务是处理人类语言。
  • Models: 指的是它们是数学模型,用来预测文本序列。

常见的挑战:Hallucination (幻觉)

在使用 Gen AI 时,你会遇到 Hallucination 现象。这是指模型生成了听起来非常合理、甚至很有说服力,但实际上是错误虚假的信息。

Pro Tip: 永远不要 100% 相信 AI 生成的事实性信息,尤其是涉及到法律、医疗或硬核技术细节时,一定要 cross-check。


为什么现在 Gen AI 这么火?

  1. Compute Power: GPU 的算力飞跃。
  2. Big Data: 互联网提供了海量的训练素材。
  3. Transformer Architecture: 谷歌在 2017 年提出的 Transformer 架构,彻底改变了 AI 处理序列数据的方式,让模型能理解更长范围的上下文。

下一步建议

Google 官方提供了很多免费的 Skill Badges。如果你想正式拿到 Google Cloud 的勋章,可以去他们的 Cloud Skills Boost 平台完成对应的课程。

在 JR Academy 的后续章节中,我们会深入 discuss 怎么用 Prompt Engineering 来让这些强大的模型更好地为你工作。

Google AI 官方精华
AI Engineer

Google AI 官方精华

由 Google 官方出品的 AI 核心系列课程,由 JR Academy 深度汉化并永久保存。

Google AI 官方精华生成式 AI 导论

Introduction to Generative AI (生成式 AI 导论)

Source: Google Cloud "Introduction to Generative AI" Course Level: Beginner (入门级) Estimated Time: 15 mins

#什么是 Generative AI?

Generative AI (简称 Gen AI) 是一种能够创建新内容的 AI 技术。不同于传统的 AI 只是分析现有的数据,Gen AI 可以根据它学到的 patterns 来 generate 全新的 text, images, audio, 甚至是 code。

#AI, ML, Deep Learning 与 Gen AI 的关系

为了搞清楚 Gen AI 在哪里,我们可以看这个层级关系:

AI Hierarchy
AI Hierarchy

  1. Artificial Intelligence (AI): 最广泛的概念,指机器模拟人类智能。
  2. Machine Learning (ML): AI 的一个子集,通过数据来让机器学习,而不是显式编程。
  3. Deep Learning: ML 的一个子集,使用神经网络 (Neural Networks) 处理更复杂的任务。
  4. Generative AI: Deep Learning 的一个子集,专注于 create new content

一句话总结:传统的 ML 擅长 Predict (预测),而 Gen AI 擅长 Create (创造)。


#Gen AI 是怎么工作的?

Gen AI 依赖于 Foundation Models。这些模型在庞大的 dataset 上进行训练,学习数据背后的统计规律。当你给模型一个 Prompt (提示词) 时,它会根据概率预测下一个最合适的 element (比如下一个词或下一个像素),从而拼凑出完整的内容。

#Discriminative vs. Generative Models

Generative vs Discriminative
Generative vs Discriminative

  • Discriminative Models (判别模型): 它们学习的是数据之间的边界。比如给一张照片,它能判断这是“猫”还是“狗”。
  • Generative Models (生成模型): 它们学习的是数据的分布。比如它可以根据学到的“猫”的特征,自己画出一只全新的“猫”。

#核心概念:Large Language Models (LLMs)

我们最常用的 ChatGPT, Claude, Gemini 都属于 Large Language Models

  • Large: 指的是它们在海量的文本数据上训练,并且拥有巨大的参数量。
  • Language: 指的是它们的主要任务是处理人类语言。
  • Models: 指的是它们是数学模型,用来预测文本序列。

#常见的挑战:Hallucination (幻觉)

在使用 Gen AI 时,你会遇到 Hallucination 现象。这是指模型生成了听起来非常合理、甚至很有说服力,但实际上是错误虚假的信息。

Pro Tip: 永远不要 100% 相信 AI 生成的事实性信息,尤其是涉及到法律、医疗或硬核技术细节时,一定要 cross-check。


#为什么现在 Gen AI 这么火?

  1. Compute Power: GPU 的算力飞跃。
  2. Big Data: 互联网提供了海量的训练素材。
  3. Transformer Architecture: 谷歌在 2017 年提出的 Transformer 架构,彻底改变了 AI 处理序列数据的方式,让模型能理解更长范围的上下文。

#下一步建议

Google 官方提供了很多免费的 Skill Badges。如果你想正式拿到 Google Cloud 的勋章,可以去他们的 Cloud Skills Boost 平台完成对应的课程。

在 JR Academy 的后续章节中,我们会深入 discuss 怎么用 Prompt Engineering 来让这些强大的模型更好地为你工作。