Pig 脚本中 filters、group、orderBy、distinct 关键字分别有什么作用?
State the usage of 'filters', 'group', 'orderBy', 'distinct' keywords in Pig scripts.
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: medium
分类: Pig 常用操作, 数据处理算子
标签: filter, group by, order by, distinct, Pig Latin
参考答案摘要
核心答案 FILTER :类似 SQL 的 WHERE ,根据谓词过滤记录,条件满足才向下游传递。 A = LOAD 'inputs' AS (name,address); B = FILTER A BY symbol MATCHES 'CM.*'; GROUP :按 key 聚合记录,收集相同 key 的记录形成一个组(Pig 中 group 与聚合函数不是强绑定)。 input2 = LOAD...
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。