什么是数据投毒(Data Poisoning)?在机器学习训练中为什么需要关注它?
What is data poisoning and why does it matter in machine learning training?
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: medium
分类: Machine Learning, Security
标签: training data, robustness
参考答案摘要
答案 数据投毒 指攻击者向训练数据中注入恶意样本/标签(或篡改分布),让模型在特定输入上产生错误预测,甚至整体性能下降。它在开放数据采集、众包标注、在线学习等场景更常见。防护思路包括:数据来源与权限控制、异常检测与去噪、鲁棒训练(如损失裁剪/对抗训练)、审计追踪、以及在上线后监控概念漂移与异常输出。
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。