ML/数据工程师进 AWS MLOps 岗位的敲门砖 — 动手写过 SageMaker Pipeline 的人考这张最划算。
先把考试形式、适合人群、备考时长和学习范围讲清楚,再决定要不要投入时间。
AWS Certified Machine Learning Engineer - Associate(MLA-C01)是 AWS 2024 年 8 月 GA 的新认证,定位为 AIF-C01(Practitioner)之上的工程师级 ML 认证。在它出现之前,AWS 的 ML 类认证只有 Specialty 级别的 MLS-C01,考的是数据科学家的算法理论(梯度下降、SVM、confusion matrix)。MLA-C01 把侧重点从"懂算法"换成了"会用 SageMaker 把模型落地到生产",更贴近真实的 MLOps 岗位工作内容。
考试费 $150 USD,65 题、130 分钟、720/1000 及格、3 年有效期。题型是单选 + 多选 + ordering + case study,考纲 4 大领域:Data Preparation for ML(28%)、ML Model Development(26%)、Deployment and Orchestration of ML Workflows(22%)、Monitoring/Maintenance/Security(24%)。注意权重最大的不是建模,而是数据准备(28%)— 这反映了真实工作里 ML 工程师 70% 时间在处理数据的事实。
和 AIF-C01 最大的区别:AIF 是概念题考你知不知道 Bedrock、SageMaker、RAG 是啥;MLA 是场景题考你怎么在 SageMaker 里把一个模型从数据摄取一路跑到实时端点。考题会问你 Feature Store 的 online store 和 offline store 分别用在什么场景、Multi-Model Endpoint 和 Multi-Container Endpoint 什么时候选哪个、Model Monitor 的 4 种监控类型(Data Quality / Model Quality / Bias Drift / Feature Attribution Drift)哪种能抓到你描述的漂移。没有亲手跑过 SageMaker Pipeline 的人基本答不出来。
MLA 同时也在逐步替代 MLS-C01 Specialty 在招聘市场的位置。2026 年 AWS 官方已经把 MLS-C01 标为 "retiring",大部分 JD 开始写 "MLA-C01 preferred"。这张证现在是你简历上最有说服力的 "AWS ML 工程能力" 证明。
AWS ML Engineer Associate 持证人的薪资区间、对应岗位、以及真实的职业影响。
为什么这张证的薪资比 SAA 高一档
ML 工程师岗位本来就属于云岗位里的 premium tier。Levels.fyi 2026 年数据显示,美国 ML Engineer 中位数 $178k,比同级别 Backend Engineer 高 15–25%;旧金山湾区资深 MLOps 能到 $260k+。澳洲 Seek 上 2026 Q1 标 "SageMaker" 的岗位中位数 $165k AUD,比标 "AWS" 不带 ML 的高 $30k。这个薪资差不是因为 MLA-C01 这张证,而是因为 ML 是供不应求的技能方向,MLA 只是帮你把简历推进到面试环节。
最适合考 MLA-C01 的三类人:
谁不应该考 MLA-C01:
这里不是装饰信息,它决定你应该先把时间砸在哪些知识域上。
Data Preparation for ML
Model Development
Deployment and Orchestration
Monitoring and Security
过来人总结的分阶段备考节奏,按周拆分,不是空话。
不要先看书也不要先刷题。打开一个 AWS 账号,进 SageMaker Studio,跟着官方 sample notebook 跑一遍"从 S3 读数据 → Processing Job 清洗 → 训练 XGBoost → 部署实时 Endpoint → 调用推理"的完整流程。亲手点过一遍之后,后面的考题里所有"这个按钮在哪个服务里"的问题都会秒答。没动过 SageMaker 控制台就开始刷题是最大的时间浪费。
按权重顺序刷:Data Preparation(28%)→ Model Development(26%)→ Monitoring(24%)→ Deployment(22%)。重点搞懂这些对子:Glue ETL vs SageMaker Processing Job、Feature Store online vs offline、BYOC vs Script Mode、Bayesian vs Hyperband 超参调优、Real-time vs Batch vs Async vs Serverless 推理、Data Quality vs Model Quality vs Bias Drift 监控。每一对都是送分题源泉。
MLA 的 case study 题都是 MLOps 场景:"客户的模型上线 3 个月后准确率下降,你怎么设计自动再训练流程?" 答题套路:Model Monitor 检测 Model Quality Drift → CloudWatch 告警 → EventBridge 触发 → Step Functions 或 SageMaker Pipelines 执行再训练 → Model Registry 审批 → 蓝绿部署到 Endpoint。把这套反射练熟,场景题基本不会错。
做 3-5 套 65 题全真模考(Tutorials Dojo 的质量最高),稳定 75% 以上再去考。低于 70% 再准备一周,$150 考试费不便宜,别硬上。考试当天前 60 分钟快速过一遍单选题,case study 和 ordering 留到最后集中处理 — 这类题一旦读错条件就容易全错。
过来人的备考时长、分数、以及踩过的坑。
我之前只会在 Jupyter 里跑模型,连 Endpoint 是什么都不知道。5 周备考最大的收获不是证书,是真的学会了怎么把一个 notebook 变成一个 Pipeline。现在面试被问 MLOps 流程不再卡壳。Data Preparation 那块权重最大,一定要把 Feature Store 和 Data Wrangler 亲手跑一遍,光看文档记不住。
有 2 年 PyTorch + AWS 经验,4 周很轻松。考试里 Deployment 那块是我的强项 — Multi-Model Endpoint 和 Async Inference 这类题看场景秒选。难的是 SageMaker 的冷门细节,比如 Canvas、Ground Truth、JumpStart 这些服务的边界。建议考前一天把 SageMaker 的全家桶服务列表过一遍,保证每个都能一句话说清用途。
零 ML 基础硬上,前 4 周补 Andrew Ng 的 ML 课,后 6 周专攻 MLA。险过。最痛苦的是 Model Development 那块 — 什么时候用 XGBoost 什么时候用 Linear Learner、Bayesian 和 Hyperband 差别在哪,这些没做过项目的人全靠背。建议像我这样的零基础至少留 10-12 周,别被"Associate 级别"骗了,MLA 比 SAA 难一档。
| AWS ML Engineer Associate | AWS AI Practitioner | AWS SAA考证 | |
|---|---|---|---|
| 机构 | AWS | AWS | AWS |
| 级别 | 助理级 | 基础级 | 助理级 |
| 考试费 | $150 | $75 | $150 |
| 时长 | 170 min | 90 min | 130 min |
| 题量 | 65 | 65 | 65 |
| 有效期 | 3 年 | 3 年 | 3 年 |
**先动手再刷题** — SageMaker Studio 免费 tier 够你跑完整个 Pipeline。亲手跑过一次 XGBoost 训练 + 部署的人,至少省 20% 的备考时间。
**Tutorials Dojo 的 MLA-C01 题库目前质量最高** — Whizlabs 也行但覆盖面稍弱。官方 Skill Builder 的 Exam Prep 免费但题量少,建议作为补充不作为主力。
**记住 4 大领域权重分配** — Data Prep 28% + Model Dev 26% = 54%,前两块是大头。如果时间不够,优先把这两块刷到 80% 正确率,Monitoring 和 Deployment 能保证 70% 就够过线。
**申请 ESL +30 分钟加时** — 母语不是英语就在报名时勾选 ESL Accommodation,免费从 130 分钟加到 160 分钟。MLA 的 case study 题文字量大,加时非常必要。
**考前一天做 SageMaker 服务速查表** — 把 Training、Processing、Pipelines、Feature Store、Data Wrangler、Ground Truth、JumpStart、Canvas、Model Monitor、Clarify、Model Registry、Endpoints 这 12 个核心服务各写一句话用途,考试时看到任何服务名都能秒反应。
**JumpStart vs 自定义训练搞混** — JumpStart 是一键部署预训练模型(HuggingFace、Stable Diffusion 等),适合快速 POC;自定义训练用于特定业务数据。考题看到"快速上线现成模型"选 JumpStart,看到"基于公司历史数据训练"选 SageMaker Training Job + BYOC / Script Mode。
**超参调优策略选错** — Random Search 简单但低效;Bayesian 适合大多数场景(考试默认正确答案);Hyperband 适合深度学习可以 early stopping 的场景;Grid Search 考试几乎不选(太慢)。题目说"高效找到最优超参"优先选 Bayesian,说"训练时间长可 early stop"选 Hyperband。
**数据漂移检测服务混淆** — Data Quality Drift(输入特征分布变化)→ Model Monitor Data Quality;Model Quality Drift(预测准确率下降)→ Model Monitor Model Quality(需要 ground truth labels);Bias Drift(模型对某群体预测偏差)→ Model Monitor Bias Drift + Clarify;Feature Attribution Drift(特征重要性变化)→ Model Monitor Feature Attribution。考题会给具体症状,你要选对监控类型。
**Batch vs Real-time vs Async vs Serverless Endpoint 选错** — Real-time:低延迟、稳定流量;Batch Transform:离线大批量、无延迟要求、最便宜;Async Inference:大 payload(>6MB)或长耗时(>60s)、可接受分钟级延迟;Serverless:间歇流量、冷启动可接受、按调用计费。看到"大文件""长推理时间"几乎一定选 Async,看到"每天凌晨跑一次"选 Batch Transform。
**把 SageMaker Pipelines 和 Step Functions 当作同一个东西** — SageMaker Pipelines 是 ML 原生的 DAG,和 Model Registry、Experiments 深度集成,适合纯 ML 工作流;Step Functions 适合编排跨服务的复杂工作流(ML + Lambda + DynamoDB + SNS)。考题看到"纯 ML 训练 + 部署流程"选 Pipelines,看到"ML + 多个 AWS 服务协同"选 Step Functions。
49+ 练习题、章节学习路径、模考、错题复盘和 AI 导师都在备考页里。
进入备考页$29 起 · 前 2 章可免费试学