Hadoop 里的 RecordReader 有什么作用?
What is the use of RecordReader in Hadoop?
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: hard
分类: MapReduce, InputFormat/RecordReader
标签: recordreader, inputsplit, inputformat, key-value, mapper
参考答案摘要
TL;DR InputSplit 只定义工作切片,但不说明如何访问数据; RecordReader 负责从数据源读取字节流,并转换成 mapper 可读取的 record-oriented key-value pairs 。InputFormat 会定义具体使用哪个 RecordReader 实例。
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。