1. 什么是监督学习和无监督学习?
答案:
- 监督学习是指通过使用带标签的数据来训练模型,目标是预测输入数据的标签或结果。常见的算法包括线性回归、逻辑回归、支持向量机(SVM)等。
- 无监督学习是指在没有标签数据的情况下,训练模型进行模式识别和数据聚类。常见的无监督学习算法包括K-means聚类、层次聚类和主成分分析(PCA)。
2. 什么是过拟合?如何防止过拟合?
答案:
- 过拟合是指模型在训练数据上表现很好,但在未见过的数据上表现差,导致其泛化能力差。过拟合通常发生在模型复杂度过高时。
- 防止过拟合的方法包括:
正则化(如L1、L2正则化);
早停(在验证集性能不再提高时停止训练);