Hadoop 与其他并行计算系统相比有什么不同?
How is Hadoop different from other parallel computing systems?
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: hard
分类: 大数据引擎对比, 分布式系统设计
标签: hadoop, distributed-file-system, data-locality, redundancy, rdbms, hbase
参考答案摘要
TL;DR Hadoop 的核心是 分布式文件系统(HDFS)+ 数据冗余 ,能把大规模数据存储在多台机器上,并利用 数据本地性 在数据所在节点进行计算,减少网络传输;而传统关系型数据库适合实时查询,但不适合以表结构存储超大规模数据。Hadoop 还可通过 HBase 构建列式数据库以支持运行时查询。 Hadoop 的关键优势 分布式存储 + 冗余 :数据跨多个节点存储并保持副本 分布式计算(Da...
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。