什么是 MapReduce?它的 map() 和 reduce() 分别做什么?
What is MapReduce?
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: easy
分类: Hadoop, MapReduce Basics
标签: mapreduce, mapper, reducer, key-value, hadoop
参考答案摘要
MapReduce 是什么? MapReduce 是 Hadoop 的核心分布式计算框架,用于在 Hadoop 集群中跨大量服务器并行处理大规模数据集。 MapReduce 两个关键阶段 map() :把输入数据拆分并转换成一组 key/value 对(tuples)。 reduce() :将 map 输出(tuples)按 key 聚合合并,生成更小、更集中、最终的 key/value 输出。 ...
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。