Sqoop 和 Hadoop 的 distcp 是否相同?为什么?
Is Sqoop the same as distcp in Hadoop?
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: medium
分类: 工具对比, 数据迁移
标签: Sqoop, distcp, HDFS, RDBMS, map-only jobs
参考答案摘要
核心答案 不相同。虽然 distcp 的 import 操作与 Sqoop import 都会提交并行的 map-only 作业,但两者目标不同: distcp :用于在本地文件系统与 HDFS 之间复制 任意类型文件 。 Sqoop :用于在 RDBMS 与 Hadoop 生态组件(如 HDFS/Hive/HBase)之间传输数据记录 。
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。