什么是 InputFormat?它的作用是什么?
What is InputFormat in Hadoop?
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: medium
分类: InputFormat, MapReduce Internals
标签: inputformat, split, recordreader, mapper
参考答案摘要
InputFormat 是什么? InputFormat 定义了 MapReduce 作业的输入规范,主要负责把输入文件切分并为 mapper 提供可读取的记录。 主要职责 校验输入规范 (validates input-specification)。 切分输入文件 为逻辑片段 InputSplit,并分配给 mapper。 提供 RecordReader ,从 InputSplit 中解析记录,...
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。