生成式 AI 导论
什么是 Gen AI,它与传统的机器学习有什么区别
Source: Google Cloud "Introduction to Generative AI" Course Level: Beginner (入门级) Estimated Time: 15 mins
什么是 Generative AI?
Generative AI (简称 Gen AI) 是一种能够创建新内容的 AI 技术。不同于传统的 AI 只是分析现有的数据,Gen AI 可以根据它学到的 patterns 来 generate 全新的 text, images, audio, 甚至是 code。
AI, ML, Deep Learning 与 Gen AI 的关系
为了搞清楚 Gen AI 在哪里,我们可以看这个层级关系:
- Artificial Intelligence (AI): 最广泛的概念,指机器模拟人类智能。
- Machine Learning (ML): AI 的一个子集,通过数据来让机器学习,而不是显式编程。
- Deep Learning: ML 的一个子集,使用神经网络 (Neural Networks) 处理更复杂的任务。
- Generative AI: Deep Learning 的一个子集,专注于 create new content。
一句话总结:传统的 ML 擅长 Predict (预测),而 Gen AI 擅长 Create (创造)。
Gen AI 是怎么工作的?
Gen AI 依赖于 Foundation Models。这些模型在庞大的 dataset 上进行训练,学习数据背后的统计规律。当你给模型一个 Prompt (提示词) 时,它会根据概率预测下一个最合适的 element (比如下一个词或下一个像素),从而拼凑出完整的内容。
Discriminative vs. Generative Models
- Discriminative Models (判别模型): 它们学习的是数据之间的边界。比如给一张照片,它能判断这是“猫”还是“狗”。
- Generative Models (生成模型): 它们学习的是数据的分布。比如它可以根据学到的“猫”的特征,自己画出一只全新的“猫”。
核心概念:Large Language Models (LLMs)
我们最常用的 ChatGPT, Claude, Gemini 都属于 Large Language Models。
- Large: 指的是它们在海量的文本数据上训练,并且拥有巨大的参数量。
- Language: 指的是它们的主要任务是处理人类语言。
- Models: 指的是它们是数学模型,用来预测文本序列。
常见的挑战:Hallucination (幻觉)
在使用 Gen AI 时,你会遇到 Hallucination 现象。这是指模型生成了听起来非常合理、甚至很有说服力,但实际上是错误或虚假的信息。
Pro Tip: 永远不要 100% 相信 AI 生成的事实性信息,尤其是涉及到法律、医疗或硬核技术细节时,一定要 cross-check。
为什么现在 Gen AI 这么火?
- Compute Power: GPU 的算力飞跃。
- Big Data: 互联网提供了海量的训练素材。
- Transformer Architecture: 谷歌在 2017 年提出的 Transformer 架构,彻底改变了 AI 处理序列数据的方式,让模型能理解更长范围的上下文。
下一步建议
Google 官方提供了很多免费的 Skill Badges。如果你想正式拿到 Google Cloud 的勋章,可以去他们的 Cloud Skills Boost 平台完成对应的课程。
在 JR Academy 的后续章节中,我们会深入 discuss 怎么用 Prompt Engineering 来让这些强大的模型更好地为你工作。