GenAI工作负载
Reliabiy building,delivering,&manaing generative AI workloads
关于GenAI工作负载
GenAI工作负载是一份系统化的技术学习指南,帮助你从零开始掌握等核心技能。本路线图包含18个精心设计的学习节点,预计学习时长约100小时,适合入门水平的学习者。
为什么选择这份路线图?
- 系统化的学习路径,从基础到进阶循序渐进
- 每个知识点都有详细的说明和推荐资源
- 可交互的路线图,直观了解知识点之间的关系
- 完全免费,随时随地开始学习
- 标记学习进度,追踪你的成长轨迹
核心学习内容
本路线图涵盖了等核心技术领域,以下是部分重点学习内容:
Select candidate FM(s)
这一步是从多个Foundation Model里筛选最适合业务场景的候选,例如通用大模型、垂直领域模型或不同供应商的模型版本。你需要考虑输入输出形式、语言能力、上下文长度、推理成本与合规要求,先形成一...
Prompt engineering
提示词工程的本质是通过结构化指令、示例、角色设定和约束条件,让模型在不改参数的情况下输出更稳定、更符合预期的结果。它通常是成本最低、上线最快的优化方式,适合需求变化快的场景。一个好的Prompt会同时...
Augment(such as RAG)
增强的核心思路是让模型在生成时“带着外部知识”,例如通过RAG先检索企业文档、知识库或数据库,再把相关内容注入上下文中生成答案。这样可以显著提升事实准确率与可追溯性,尤其适合需要引用最新资料或私有资料...
Fine-tuning
微调是通过训练数据让模型参数在特定任务上更“内化”你的表达风格、输出格式或领域能力,适合对稳定性和一致性要求很高的场景。相比Prompt和RAG,微调成本更高,周期更长,但一旦训练得当,推理时可能更省...
Model Evaluation Metrics
这个节点表示你已经完成一轮或多轮定制组合(Prompt/RAG/微调等),并得到一个“可被交付”的模型形态。它通常意味着你已经锁定当前版本的配置、数据、依赖组件与实验结果,具备可复现性。此时输出的应该...
Optimize model for hosting
这是让模型在生产环境中跑得更快、更省、更稳定,包括选择合适的推理部署方式(云托管/自建/边缘)、模型压缩或量化、并发与缓存策略等。你需要在延迟、吞吐、成本之间找到平衡,同时确保输出质量不被明显牺牲。它...