Hadoop 中的 SequenceFile 是什么?有哪些类型?
What is a SequenceFile in Hadoop?
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: medium
分类: MapReduce I/O, 文件格式
标签: sequencefile, binary, key-value, compression, mapreduce-io
参考答案摘要
TL;DR SequenceFile 是 Hadoop/MapReduce 常用的 I/O 格式,是一个包含 二进制 key-value 对 的扁平文件。Map 的输出通常会在内部以 SequenceFile 的形式存储,并提供 reader/writer/sorter 类。 三种 SequenceFile 格式 Uncompressed key-value records :不压缩 Record...
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。