Week 1Module 1: Introduction to Mining Big Data, Parallel Processing using MapReduce
从 big data mining 的基本问题入手,并通过 MapReduce 建立并行处理大规模数据的第一套框架。(数据来源:University of Adelaide 2025 Course Outline)
big data miningMapReduceparallel processingdistributed computation
💡 学习提示
• 帮我解释 MapReduce 为什么适合 big data 场景
• 给我一份 DATA 7203OL Module 1 的复习清单
Week 2Module 2: Similar Items and Data Streams
聚焦海量数据里的 similar items 与 data streams 问题,理解近似算法和流式处理为什么重要。(数据来源:University of Adelaide 2025 Course Outline)
similar itemsdata streamsapproximationstream processing
💡 学习提示
• 类似物品搜索和 data streams 常见用例有哪些?
• 帮我总结 Module 2 的核心算法思路
Week 3Module 3: PageRank and Frequent Item sets
学习 PageRank 与 frequent item sets,把图分析与大规模模式发现连接起来。(数据来源:University of Adelaide 2025 Course Outline)
PageRankfrequent itemsetsgraph analysispattern mining
💡 学习提示
• 帮我解释 PageRank 的基本直觉
• frequent itemsets 在大数据分析里怎么用?
Week 4Module 4: Clustering and Advertising
围绕 clustering 与 advertising 场景理解 big data analytics 如何服务于分群、画像与投放问题。(数据来源:University of Adelaide 2025 Course Outline)
clusteringadvertisingsegmentationbig data applications
💡 学习提示
• 帮我比较几种 clustering 思路
• 广告投放为什么会用到 clustering?
Week 5Module 5: Recommendation Systems and Social Networks
进入 recommendation systems 与 social networks,理解用户行为、关系结构和推荐逻辑在大规模场景下的实现方式。(数据来源:University of Adelaide 2025 Course Outline)
recommendation systemssocial networksuser behaviourgraph data
💡 学习提示
• 推荐系统和社交网络分析有什么联系?
• 帮我整理 Module 5 的核心概念图
Week 6Module 6: Dimensionality Reduction and Machine Learning and Big Data
以 dimensionality reduction 与 machine learning 收束整门课,把大规模数据表示、建模和分析问题连接成完整框架。(数据来源:University of Adelaide 2025 Course Outline)
dimensionality reductionmachine learningfeature spacebig data
💡 学习提示
• 帮我解释为什么大数据里需要 dimensionality reduction
• 把 Module 6 和前 5 个模块串成一份期末复习框架