$99 + 2 周拿一张永不过期的微软数据入门证;BA、业务分析、数据转行者最便宜的入场券,技术工程师可以直接跳 DP-203 / PL-300。
先把考试形式、适合人群、备考时长和学习范围讲清楚,再决定要不要投入时间。
Microsoft Certified: Azure Data Fundamentals(考试代号 DP-900)是微软数据认证体系最底层的一张证,2020 年上线,定位明确:给不写代码的人一套统一的数据词汇表。考纲四大块 — 核心数据概念 25-30%、关系型数据 20-25%、非关系型数据 15-20%、分析工作负载 25-30%。考试 60 分钟、40-60 题、700/1000 通过、考费 $99 USD。题型是单选、多选、判断、拖放,没有 Case Study,难度在微软所有 Fundamentals 里偏低。
最重要的两件事说在前面:
DP-900 考的不是 SQL 写法、不是 Spark 调优、也不是 Python,而是"数据的世界长什么样" — 关系型数据库 vs 非关系型数据库的差别、OLTP 和 OLAP 的工作负载特征、Azure 数据服务有哪些(Azure SQL Database、Azure SQL Managed Instance、Cosmos DB 的 5 种 API、Synapse Analytics、Data Factory、Databricks、HDInsight、Stream Analytics)、ETL 和 ELT 的区别、数据仓库 / 数据湖 / Lakehouse 三种架构的取舍、Power BI 在分析链条里的角色。它要求你能听懂这些词,但不要求你会用 — 这正是为什么它适合非工程师。
适合人群非常清晰:业务分析师(BA)想转数据分析、销售/市场需要跟客户聊数据迁移项目、传统行业 IT 要把本地 SQL Server 迁到 Azure、刚毕业想进数据岗的应届生、为 DP-203(数据工程师)或 PL-300(Power BI 数据分析师)打地基的人。如果你已经会写 PySpark 或调过 Synapse,不用考 DP-900 — 直接上 DP-203 或 PL-300,DP-900 的内容你 1 天就能扫完,证书本身在简历上不会给工程师岗加分。
Azure Data Fundamentals 持证人的薪资区间、对应岗位、以及真实的职业影响。
先把"DP-900 能不能直接换工作"说清楚
不能。DP-900 是 Foundational 认证,HR 看到它不会直接给你发 offer,但会做两件事:第一,把你的简历从"完全不懂数据"那一摞里挑出来;第二,在面试时不会问你"什么是 OLTP" — 因为有这张证就默认你懂。它的真实作用是让你的简历从被秒拒变成进入面试,至于面试能不能通过,靠的是后续的 SQL 实操、Power BI 作品集、或者真实项目经验。
真正适合考 DP-900 的人 + 对应的薪资跳跃:
这些人不要考 DP-900:
关于 DP-900 → DP-203 / PL-300 的进阶路径
DP-900 不是 DP-203 的"必修前置" — 微软官方没有强制要求,你可以直接报 DP-203。但社区数据显示,先考 DP-900 再考 DP-203 的人首考通过率明显更高(约 75% vs 直接考 DP-203 的 55%),因为 DP-900 把"数据世界的词汇表"先建好,DP-203 学起来不会被术语淹没。同样适用于 PL-300:DP-900 给你"什么是数据仓库 / Star Schema / OLAP" 的概念,PL-300 教你怎么在 Power BI 里建模型 — 顺序学体感非常顺。
这里不是装饰信息,它决定你应该先把时间砸在哪些知识域上。
Describe Core Data Concepts
Identify Considerations for Relational Data
Describe Considerations for Non-relational Data
Describe an Analytics Workload
过来人总结的分阶段备考节奏,按周拆分,不是空话。
打基础的一周,主要建立"数据是什么样子"的认知。重点:结构化 / 半结构化 / 非结构化数据的区分(表 vs JSON vs 视频)、批处理 vs 流处理的区别和典型场景、OLTP(面向事务、行存、低延迟、高并发写)vs OLAP(面向分析、列存、复杂查询、低写高读)、数据角色 — Database Administrator / Data Engineer / Data Analyst 各自做什么。这块占考试 25-30%,全是概念题没有代码,每天 1 小时跟着 Microsoft Learn 的免费 Learning Path 走完即可。
重点搞清楚 Azure 的关系型数据服务有哪几个,分别是什么使用场景:Azure SQL Database(PaaS、单数据库或弹性池、自动备份和扩缩)、Azure SQL Managed Instance(接近本地 SQL Server 的 100% 兼容、适合 lift-and-shift 迁移)、SQL Server on Azure VM(IaaS、最大控制权、自己管补丁)、Azure Database for PostgreSQL/MySQL/MariaDB。考试爱出"客户场景 → 选哪个服务"的题。SQL 部分只考最基本的 SELECT、JOIN、WHERE、GROUP BY,不要求写复杂查询,但必须能看懂语句的意思。在 Azure Portal 里实际开一个 Azure SQL Database(最便宜的 Basic 层一个月几美金或用免费额度),跑几条 SQL 查询,体感会立刻具体起来。
非关系型这块的核心是 **Azure Cosmos DB 的 5 种 API**,必考点:NoSQL API(原生文档数据库,最常用)、MongoDB API(兼容 MongoDB 协议,迁移友好)、Cassandra API(兼容 Cassandra CQL,宽列)、Gremlin API(图数据库,社交关系/推荐系统)、Table API(兼容 Azure Table Storage,简单 KV)。考试经常给一个场景让你选 API — "客户已有 MongoDB 应用想迁云" → MongoDB API;"要建社交关系图谱" → Gremlin API;"简单 key-value" → Table API。还要懂 Azure Storage 的四种类型:Blob(对象存储)、File(SMB 文件共享)、Queue(消息队列)、Table(NoSQL 键值)。
考试权重最大的一块(25-30%),也是概念最容易混的一块。必须分清四个东西:**Azure Synapse Analytics**(统一数据分析平台,包含数仓 + Spark + 数据集成)、**Azure Data Factory**(纯 ETL/ELT 编排服务,无服务器、200+ 数据源连接器)、**Azure Databricks**(Apache Spark 托管服务,重度数据科学和机器学习)、**Azure HDInsight**(开源 Hadoop/Spark/Kafka 托管,适合已有 Hadoop 技能栈迁移)。还要懂 ETL(Extract→Transform→Load,转换在中间服务器)vs ELT(Extract→Load→Transform,先入仓再用仓的算力转换)的区别和适用场景 — 现代云数仓基本都用 ELT。最后是 Power BI 在分析链路里的位置:连接数据源 → 数据建模 → 可视化 → 共享报表,知道 Power BI Desktop / Service / Mobile / Report Server 各自的角色。这周做完 1-2 套完整模拟题,稳定 80% 以上就可以约考。
过来人的备考时长、分数、以及踩过的坑。
我做 BA 五年,一直跟数据团队对需求但完全听不懂他们说的"星型模型 / 维度表 / 列存索引"是什么。公司迁 Azure 之后给我们 BA 团队报销 DP-900,我用 Microsoft Virtual Training Days 拿到免费考券,0 元考过。最大的收获不是证书 — 是我现在能听懂数据工程师在 standup 里说什么,也能在写 BRD 的时候自己描述"这条数据走 Synapse 还是直接进 Power BI"。考完两个月我从 BA 转岗 Data Analyst,涨了 18% 工资。
我没有任何工作经验,纯应届毕业想找数据相关的实习或 Junior 岗。在 LinkedIn 上看了 50 多个 Junior Data Analyst JD 之后发现 70% 都写 "Azure / DP-900 preferred",所以决定先考这张。备考 4 周(每天 1 小时),看 John Savill 的 YouTube 免费视频 + Microsoft Learn 官方 Learning Path 就够了,没买任何付费课程。考试比想象的简单,时间充裕(60 分钟做 50 题,留了 15 分钟检查)。考完两周后拿到第一个面试,3 个月内入职一家中型咨询公司做 Junior Data Analyst,起薪 75k AUD。
我是 Microsoft Solutions Partner 体系里的销售岗,公司硬性要求每个销售要持有 AZ-900 + DP-900 + AI-900 三张 Fundamentals。两周突击考完,主要学了 Cosmos DB 五种 API 和 Synapse vs Data Factory 的区别 — 这两块在客户对话里出现频率最高。说实话考前我觉得 $99 的证不会改变什么,但考完之后明显感觉跟客户聊数据迁移项目时不慌了,知道客户在说什么 service 也知道大概的定价模型。今年我的销售业绩涨了 30%,部分功劳在这套基础知识上。
| Azure Data Fundamentals | Azure Data Engineer Associate | PL-300 | |
|---|---|---|---|
| 机构 | Azure | Azure | Azure |
| 级别 | 基础级 | 助理级 | 助理级 |
| 考试费 | $99 | $165 | $0 |
| 时长 | 45 min | 100 min | 90 min |
| 题量 | 50 | 50 | 46 |
| 有效期 | 0 年 | 1 年 | 3 年 |
**先去申请免费考券** — 在你开始备考前,去 Microsoft Virtual Training Days 官网注册下一场 "Azure Data Fundamentals" 免费在线培训(两天,每天 3-4 小时)。结业 2-6 周内你的 Microsoft Learn 账户会收到 100% off 考试代金券。这步能省 $99,没理由不做。
**ESL 加时申请** — 母语非英语考生免费多 30 分钟,报名时在 Accommodation 选项里申请。DP-900 阅读量不大但 60 分钟原本就够,多 30 分钟更宽裕。
**关键词敏感**:看到 "lift-and-shift SQL Server with SQL Agent" → Azure SQL Managed Instance;看到 "global distribution low latency NoSQL" → Cosmos DB;看到 "graph relationships" → Cosmos DB Gremlin API;看到 "ELT in cloud warehouse" → Synapse;看到 "complex transaction high concurrency" → OLTP / Azure SQL Database;看到 "billions of rows aggregation report" → OLAP / Synapse;看到 "schema flexibility IoT data" → Cosmos DB / Blob Storage。
**时间分配**:60 分钟做约 50 题,平均 1 分钟出头一题,DP-900 没有 Case Study 所以时间非常充裕。建议第一遍快速过完所有题(40 分钟),剩下 20 分钟回头检查标记的不确定题。
**官方学习资源就够了** — Microsoft Learn 上的 "Azure Data Fundamentals" Learning Path 是免费且足够的,社区数据显示 70% 的考生只用 Microsoft Learn + 1-2 套模拟题就过了。不需要买昂贵的付费课程。免费模拟题来源:MeasureUp 试用版、ExamTopics、Whizlabs 免费章节。
**记住 Cosmos DB 的 5 种 API 对应表**:NoSQL(原生文档)、MongoDB(兼容协议)、Cassandra(宽列)、Gremlin(图)、Table(KV)— 至少考 2-3 道直接相关题。
**永不过期是真的** — 考完拿到证之后不用做任何 Renewal Assessment,不像 DP-203 / DP-700 那种 Associate 级证书需要每年续期。证书在你 Microsoft Learn profile 里永久显示。
**关系型数据库 vs 非关系型数据库的使用场景搞反** — 这是最经典的考点。关系型(Azure SQL Database、Postgres、MySQL)适合:强 schema、ACID 事务、复杂 JOIN 查询、银行账户余额这种强一致性场景;非关系型(Cosmos DB、Table Storage)适合:schema 灵活、海量水平扩展、低延迟键值查询、用户 session / 商品目录 / IoT 时序数据这种场景。考试爱出"以下哪个最适合 X 场景",看到"事务一致性 / 复杂报表"选关系型,看到"全球分发 / 毫秒延迟 / 灵活 schema"选 Cosmos DB。
**Cosmos DB 的 5 种 API 选错** — 必背的硬考点。题目会给一个迁移或新建场景,让你选 API:客户已有 MongoDB 应用要迁云 → MongoDB API(兼容协议、零代码改动);社交关系网络 / 推荐引擎 → Gremlin API(图数据库);从 Cassandra 迁过来 → Cassandra API;简单 key-value 不需要复杂查询 → Table API;新项目原生开发 → NoSQL API(原生最优、功能最全)。常见错误是把 NoSQL API 和 MongoDB API 搞混 — 前者是 Cosmos 原生的,后者是协议兼容层。
**Synapse Analytics vs Azure Data Factory 分不清** — 这两个都做 ETL,但定位完全不同:**Data Factory** 是纯粹的数据集成 / ETL 编排服务,没有数据存储和分析能力,只负责把数据从 A 搬到 B 并做转换;**Synapse Analytics** 是统一的分析平台,**包含**数据集成(Synapse Pipelines = 内嵌的 ADF)+ 数仓(专用 SQL 池 + 无服务器 SQL 池)+ Spark 池 + Data Explorer 池,是一个全家桶。考试看到"只需要数据集成不需要分析" → ADF;看到"数据集成 + 分析 + 数据科学一体化" → Synapse。
**ETL 和 ELT 的区别和适用场景搞反** — ETL(Extract→Transform→Load):在到达目标存储**之前**用中间服务器/工具做转换,传统数仓时代的主流模式,适合源系统格式复杂、目标存储算力有限;ELT(Extract→Load→Transform):先把原始数据**直接灌入**目标存储(数据湖或现代云数仓),**再利用目标的算力**做转换,现代云原生模式,适合 Synapse / Snowflake / BigQuery 这种弹性算力的数仓。考试看到"利用数仓自身算力" → ELT;看到"数据进入仓库前清洗" → ETL。
**OLTP 和 OLAP 的工作负载特征搞混** — OLTP(在线事务处理):高并发写、低延迟、行存、短小事务、典型场景银行转账 / 电商下单 / 库存更新;OLAP(在线分析处理):低并发但大批量读、复杂聚合查询、列存、典型场景月度销售报表 / 多维分析。考试看到"几千个并发事务、毫秒响应" → OLTP;看到"扫描亿行数据做聚合" → OLAP。
**Azure SQL Database / Managed Instance / SQL Server on VM 选错** — 三个的区别:Azure SQL Database 是 PaaS,最省心但兼容性不是 100%(不支持 SQL Agent、Cross-Database Query 等);Managed Instance 是 PaaS 但**接近 100% 兼容本地 SQL Server**,适合 lift-and-shift 迁移有大量存储过程和 SQL Agent Job 的老系统;SQL Server on VM 是 IaaS,自己装自己管,最大控制权但运维负担最大。考试看到"客户有大量 SSIS 包和 SQL Agent Job 要迁云" → Managed Instance;看到"全新项目要省运维" → SQL Database;看到"需要完全 OS 级控制" → VM。
**Power BI 的几个版本搞混** — Power BI Desktop(免费桌面应用,做数据建模和报表设计)、Power BI Service(云端 SaaS,发布分享报表)、Power BI Mobile(手机查看)、Power BI Report Server(本地部署版本,给不能上云的客户用)。考试常考"客户不能把数据上云但要 Power BI 报表" → Report Server。
362+ 练习题、章节学习路径、模考、错题复盘和 AI 导师都在备考页里。
进入备考页$19 起 · 前 2 章可免费试学