如何写一个 Job:按条件过滤数据集中的记录?
Write a Talend job that filters records from a dataset based on a specific condition.
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: medium
分类: ETL, Talend Components
标签: tFilterRow, Reject Flow, Data Quality
参考答案摘要
答案 新建 Job 后用 tFileInputDelimited(或 tDBInput 等)读入数据;接一个 tFilterRow(或在 tMap 中用过滤表达式)配置过滤条件(数值范围、字符串匹配、空值判断等);过滤后的主流输出到 tFileOutputDelimited / tDBOutput,未通过条件的记录可走 reject 输出用于审计或回查。面试时强调“主流/拒绝流”的设计与可追溯性。
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。