logo

L1 和 L2 正则的区别是什么?分别更适合什么场景?

What’s the difference between L1 and L2 regularization and when to use each?

题目类型: 技术面试题

这是一道技术面试题,常见于澳洲IT公司面试中。

难度: easy

分类: Machine Learning

标签: L1, L2, elastic net, weight decay

参考答案摘要

答案 L1 是对权重绝对值求和(稀疏倾向),L2 是对权重平方求和(平滑收缩)。 L1 :会把一部分权重压到 0,具有特征选择效果,适合高维稀疏特征(如 one-hot/文本)或希望模型可解释。 L2 :倾向于让权重变小但不为 0,训练更稳定,适合大多数连续特征与深度模型(也对应 weight decay 的常见形式)。 实际工程里也常用 Elastic Net(L1+L2)折中稀疏与稳定性。

本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。

← 返回面试题库

L1 和 L2 正则的区别是什么?分别更适合什么场景?

Easyregularization

想查看完整答案?

登录匠人学院学习中心,获取 STAR 格式回答和详细技术解析

前往学习中心查看答案