训练分类模型时,树模型如何防止过拟合?
Let’s say you’re training a classification model. How would you combat overfitting when building tree-based models?
题目类型: 技术面试题
这是一道技术面试题,常见于澳洲IT公司面试中。
难度: hard
分类: Machine Learning, Model Improvement
标签: Pruning, Early Stopping, Random Forest, XGBoost
目标公司: TikTok
参考答案摘要
答案 我会从“限制复杂度 + 提升泛化 + 正确评估”入手:1)预剪枝/正则:限制 max_depth、min_samples_leaf、min_samples_split、max_leaf_nodes,或对 GBDT 加 L1/L2、subsample/colsample;2)后剪枝:对单棵树做 cost-complexity pruning;3)集成方法:Random Forest 通过 ba...
本题提供 STAR 原则详细解答和技术解析,登录匠人学院学习中心即可查看完整答案。