Week 1Trustworthiness 维度导论
建立课程主线:为什么现代 ML 系统在真实部署中不能只看 accuracy。课程会先定义 privacy、robustness、reliability 和 fairness 这些 trustworthiness 维度,并通过现实失败案例解释为什么 critical application 场景必须同时优化这些目标。
Week 2Threat Models 与 Information Leakage
进入课程第一大模块:理解不同 threat model 下的信息泄露问题。重点通常包括 inference attacks、membership / attribute leakage 等风险,以及为什么看似普通的训练与推理流程会暴露敏感数据。
Week 3Privacy Protection for ML Pipelines
继续围绕保护敏感数据展开,讨论在分析和建模过程中可采用的保护策略。你需要开始比较保护强度、实用性和模型性能之间的 trade-off,并为第一个 programming and research-based project 做准备。
Week 4Adversarial Attacks, Poisoning 与 Robustness
从 privacy 过渡到 robustness,分析 adversarial attacks、data poisoning 等攻击如何影响模型行为。课程重点不是只列攻击类型,而是训练你理解 threat assumptions、攻击面和防御评估方法。
Week 5Project 1 与 Deployed AI Failures
第一个项目节点通常要求你把前几周的威胁建模与保护思路落到具体实验或研究分析中。同时课程会继续讨论真实部署 AI systems 的失败案例,帮助你把漏洞与系统后果连接起来。
Week 6Reliability through Unsupervised Methods
官方内容明确提到 anomaly detection、alarm correlation 和 intrusion detection。课程会开始介绍如何利用 unsupervised learning 提升系统可靠性,尤其是在异常行为识别和 security analytics 场景中的应用。
Week 7Anomaly Detection 与 Alarm Correlation
进一步细化 reliability 模块,比较不同异常检测思路在噪声、稀有事件和高维特征下的优缺点。常见难点在于如何把 detection 结果真正转化为可解释、可行动的安全或运维决策。
Week 8Intrusion Detection 与 Security Analytics
把 trustworthy ML 拉到更接近安全研究的应用场景中,讨论 intrusion detection 的建模挑战、特征偏移、误报漏报成本以及部署评估。这里通常是项目选题与现实应用最贴近的一段。
Week 9Fairness, Reliability 与 Evaluation Trade-offs
重新回到课程开头提出的多个 trustworthiness 维度,分析 fairness、robustness、privacy 和 reliability 之间并不总能同时最优。你需要学会解释评估指标背后的价值取舍,而不是把 trustworthy 当成单一技术指标。
Week 10Emerging Issues in Security Analytics
官方 indicative content 最后明确提到 recent trends 和 theoretical challenges。课程通常会在这一段引入更前沿的问题,例如 evolving threats、distribution shift、defensive generalisation 与模型在动态攻击环境中的脆弱性。
Week 11Project 2: Research-based Trustworthy ML
第二个 project 节点权重更高,通常要求你更完整地把 threat model、方法设计、实验评估和结果分析串起来。到这一步,老师更看重你能否清楚说明为什么某种方法在 trustworthiness 上更可信,而不是只给出表面性能。
Week 12Hurdle Exam Prep 与综合收束
最后一周会把 privacy、robustness、reliability、fairness 与 security analytics 重新整合,准备 2 小时 written exam。复习时重点不是背定义,而是训练自己在新 threat scenario 下快速判断风险类型、方法边界和评估方式。