Week 1并行与分布式计算导论 (Intro to PDC)
### 📊 核心知识点:并行计算基础 本周介绍并行与分布式计算(PDC)的基本概念、Moore's Law 的局限性以及 Flynn's Taxonomy。理解集群与云作为解决大数据计算问题的演进逻辑。 - **核心概念/公式**: Parallel vs Distributed, Speedup, Efficiency, Flynn's Taxonomy (SISD, SIMD, MISD, MIMD). ⏰ **本周节奏**: 难度 ⭐⭐ | 预计投入 10h(Lecture 3h + 自学 4h + Lab 3h) 🎯 **考试关联**: 考察并行计算的基础定义与加速比计算公式。 🧪 **Tutorial/Lab**: 熟悉 Melbourne Research Cloud (MRC) 环境申请与 Linux 基础操作。 📌 **作业关联**: 为 Project 1 的环境配置做准备。 ⚠️ **易错点**: 混淆并行计算(单机多核/紧耦合)与分布式计算(多机/松耦合)的区别。 (数据来源:2025 Course Handbook)
Week 2集群架构与资源管理 (Cluster Architecture)
### 🧠 核心知识点:集群组成与节点管理 深入探讨集群计算的硬件架构、互连网络(Interconnects)以及资源管理器的角色。了解单系统镜像(SSI)的目标与挑战。 - **核心概念/公式**: Commodity Off-the-shelf (COTS), Interconnect Latency, Resource Management. ⏰ **本周节奏**: 难度 ⭐⭐⭐ | 预计投入 12h 🎯 **考试关联**: 集群中节点故障处理机制与可用性计算。 🧪 **Tutorial/Lab**: 练习在多个 MRC 实例上配置 SSH 免密登录与基础集群通信。 📌 **作业关联**: Project 1 发布,通常涉及简单分布式爬虫或数据处理。 ⚠️ **易错点**: 忽略网络延迟对集群扩展性的负面影响。 (数据来源:2025 Course Handbook)
Week 3并行编程模型与 MPI (Parallel Programming & MPI)
### 🔀 核心知识点:消息传递接口 (MPI) 学习消息传递模型,掌握 MPI 的核心操作(Send/Receive, Broadcast, Scatter/Gather)。理解死锁预防与通信优化。 - **核心概念/公式**: MPI_Send, MPI_Recv, Blocking vs Non-blocking communication. ⏰ **本周节奏**: 难度 ⭐⭐⭐⭐ | 预计投入 15h 🎯 **考试关联**: 编写或分析简单的 MPI 并行程序逻辑。 🧪 **Tutorial/Lab**: 使用 Python (mpi4py) 或 C 实现并运行第一个并行计算小程序。 📌 **作业关联**: Project 1 的核心代码编写阶段。 ⚠️ **易错点**: 在阻塞式通信中因逻辑不当导致系统永久挂起(Deadlock)。 (数据来源:2025 Course Handbook)
Week 4调度与单系统镜像 (Scheduling & SSI)
### 🗓️ 核心知识点:作业调度算法 探讨集群中的作业调度策略(FIFO, Priority, Gang Scheduling)。理解 SSI 如何让集群看起来像一台机器。 - **核心概念/公式**: Job Scheduling, Resource Allocation, Load Balancing. ⏰ **本周节奏**: 难度 ⭐⭐⭐ | 预计投入 12h 🎯 **考试关联**: 各种调度算法的吞吐量与周转时间对比。 🧪 **Tutorial/Lab**: 模拟不同负载下的作业分配与性能表现。 📌 **作业关联**: **Project 1 截止**。 🔥 高压周 ⚠️ **易错点**: 误以为单系统镜像就是完全透明的分布式操作系统。 (数据来源:2025 Course Handbook)
Week 5网格计算基础 (Grid Computing Foundations)
### 🌐 核心知识点:计算网格与中间件 学习网格计算的历史、Globu 体系结构以及虚拟组织(VO)的概念。理解网格与现代云的区别。 - **核心概念/公式**: Virtual Organizations, Grid Middleware, Heterogeneous resources. ⏰ **本周节奏**: 难度 ⭐⭐ | 预计投入 8h 🎯 **考试关联**: 网格计算与云计算的特征对比。 🧪 **Tutorial/Lab**: 分析大型网格项目的架构案例。 📌 **作业关联**: 准备 Project 2 的需求分析。 ⚠️ **易错点**: 混淆网格(强调资源共享与异构)与云(强调服务化与按需付费)。 (数据来源:2025 Course Handbook)
Week 6虚拟化技术 (Virtualization)
### 💻 核心知识点:Hypervisors 与容器化 深入理解全虚拟化、半虚拟化以及容器技术(Docker)。探讨资源隔离与性能开销的权衡。 - **核心概念/公式**: Type 1/2 Hypervisors, Xen, KVM, Docker Containers. ⏰ **本周节奏**: 难度 ⭐⭐⭐ | 预计投入 12h 🎯 **考试关联**: 虚拟化带来的性能损耗分析及容器与 VM 的差异。 🧪 **Tutorial/Lab**: 在 MRC 实例上安装 Docker 并构建自己的微服务镜像。 📌 **作业关联**: **Project 2 发布**,墨大“神课”核心——大规模云端数据挖掘系统。 ⚠️ **易错点**: 对虚拟网络层(Virtual Network)的配置理解模糊导致实例无法互通。 (数据来源:2025 Course Handbook)
Week 7云计算范式 (Cloud Computing Paradigms)
### ☁️ 核心知识点:IaaS, PaaS, SaaS 详解 学习云计算的服务模型与部署模型(Public, Private, Hybrid)。探讨弹性伸缩与多租户隔离。 - **核心概念/公式**: NIST Cloud Definition, Elasticity vs Scalability, Service Level Agreements (SLA). ⏰ **本周节奏**: 难度 ⭐⭐⭐ | 预计投入 10h 🎯 **考试关联**: 分析特定业务场景应选择哪种云服务模型。 🧪 **Tutorial/Lab**: 使用 OpenStack/MRC API 动态管理云资源。 📌 **作业关联**: Project 2 架构设计:前端展示、后端处理、数据库集群的联动。 ⚠️ **易错点**: 错误地将“弹性”等同于“无限资源”。 (数据来源:2025 Course Handbook)
Week 8云应用编程模型 (MapReduce & Programming Models)
### 🛠️ 核心知识点:MapReduce 深度解析 掌握 Google MapReduce 论文核心思想,学习 Map, Shuffle, Reduce 过程。理解 Task 与 Thread 并行的差异。 - **核心概念/公式**: MapReduce Algorithm, Fault Tolerance in MapReduce, Task Parallelism. ⏰ **本周节奏**: 难度 ⭐⭐⭐⭐ | 预计投入 16h 🎯 **考试关联**: 给出特定问题(如 Word Count 或 Top K),写出 Map 和 Reduce 函数伪代码。 🧪 **Tutorial/Lab**: 在 Hadoop 或类似环境中运行 MapReduce 作业,体验数据局部性优化。 📌 **作业关联**: Project 2 的数据处理核心模块必须采用并行处理思路。 ⚠️ **易错点**: 在 Map 阶段输出过大导致网络带宽成为系统瓶颈。 (数据来源:2025 Course Handbook)
Week 9大数据处理与分布式分析 (Big Data Processing)
### 📈 核心知识点:4V 特征与流处理 探讨大数据分析的挑战,对比批处理(Batch)与流处理(Stream)的实时性。学习分布式计算在商业智能中的应用。 - **核心概念/公式**: Volume, Velocity, Variety, Veracity, Lambda Architecture. ⏰ **本周节奏**: 难度 ⭐⭐⭐ | 预计投入 12h 🎯 **考试关联**: 大数据处理系统中的容错与一致性权衡。 🧪 **Tutorial/Lab**: 使用分布式分析工具处理真实的社交媒体数据(如 Twitter/X 数据)。 📌 **作业关联**: Project 2 数据抓取与预处理阶段。 ⚠️ **易错点**: 忽略数据倾斜(Data Skew)对分布式计算任务效率的影响。 (数据来源:2025 Course Handbook)
Week 10云存储与 NoSQL (Cloud Storage & CouchDB)
### 🗄️ 核心知识点:最终一致性与 CouchDB 学习 NoSQL 数据库的设计理念,重点掌握 CouchDB 的分层架构、Map-Reduce Views 以及最终一致性机制。 - **核心概念/公式**: BASE (Basically Available, Soft state, Eventual consistency), CAP Theorem revisit. ⏰ **本周节奏**: 难度 ⭐⭐⭐⭐ | 预计投入 14h 🎯 **考试关联**: 对比 RDBMS 与 NoSQL 的适用场景,考察 CAP 定理的权衡。 🧪 **Tutorial/Lab**: 配置 CouchDB 集群,实现跨节点的数据同步与视图查询。 📌 **作业关联**: Project 2 存储层必须使用 CouchDB 且支持分片或备份。 ⚠️ **易错点**: 在设计 CouchDB View 时忘记处理空数据或异常格式数据。 (数据来源:2025 Course Handbook)
Week 11部署自动化 (Deployment Automation & Ansible)
### 🤖 核心知识点:Infrastructure as Code (IaC) 学习使用 Ansible 实现云端实例的自动化部署与配置。掌握 Playbooks, Inventory 和 Roles 的使用。 - **核心概念/公式**: Idempotency, Ansible Playbooks, Configuration Management. ⏰ **本周节奏**: 难度 ⭐⭐⭐⭐ | 预计投入 18h 🎯 **考试关联**: 简述自动化部署的优势及如何实现配置的幂等性。 🧪 **Tutorial/Lab**: 编写一个 Ansible Playbook,一键部署并启动整个 Web 集群系统。 📌 **作业关联**: **Project 2 截止**。 🔥 全学期最高压周,要求提交完整的系统运行视频、代码与报告。 ⚠️ **易错点**: Ansible 脚本在异构环境中缺乏幂等性检查,导致重复执行报错。 (数据来源:2025 Course Handbook)
Week 12前沿趋势与复习 (Future Directions & Exam Prep)
### 📝 复习周:全课知识体系梳理 总结从单机到集群、从集群到云、从云到大数据处理的演进。展望边缘计算(Edge)与无服务器架构(Serverless)。 - **核心概念/公式**: Serverless, Edge Computing, PDC Summary, Exam Strategy. ⏰ **本周节奏**: 难度 ⭐⭐⭐⭐ | 预计投入 20h+ 🎯 **考试关联**: 模拟历年考题中的大型系统架构设计题,综合运用本学期所有知识点。 🧪 **Tutorial/Lab**: 复盘 Project 2 的开发经验,查漏补缺。 📌 **作业关联**: 回顾所有反馈,固化技术模板。 ⚠️ **易错点**: 复习时容易沉迷于具体 API 细节,而忽略了分布式系统的底层设计哲学。 (数据来源:2025 Course Handbook)