Pig 脚本中 filters、group、orderBy、distinct 关键字分别有什么作用?
State the usage of 'filters', 'group', 'orderBy', 'distinct' keywords in Pig scripts.
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: medium
分类: Pig 常用操作, 数据处理算子
标签: filter, group by, order by, distinct, Pig Latin
参考答案摘要
核心答案 FILTER :类似 SQL 的 WHERE ,根据谓词过滤记录,条件满足才向下游传递。 A = LOAD 'inputs' AS (name,address); B = FILTER A BY symbol MATCHES 'CM.*'; GROUP :按 key 聚合记录,收集相同 key 的记录形成一个组(Pig 中 group 与聚合函数不是强绑定)。 input2 = LOAD...
答题技巧
技术面试题建议先理清思路再作答,从基础概念讲起,逐步深入。可以结合实际项目经验解释技术原理,展示你的理解深度和实践能力。
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案、收藏题目并进行模拟面试练习。