什么是模型过拟合?有哪些原因会导致过拟合?如何解决?
1 1005
1
该提问暂无详细描述
收藏
2021-01-12 18:45 更新 🍊小桔子 •  2233
共 1 个回答
高赞 时间
1

在有监督的机器学习中,无论我们选择哪种方法,比如分类或回归问题,模型的选择对于获得最佳结果都是极为重要的。对于模型,我们希望具有低偏差和低方差,但这很难实现。因此,我们确定了偏差和方差之间的差异非常小的点。 当我们在训练数据上训练模型时,预测值和实际值之间的误差称为偏差。偏差是指由于算法过于简单的假设或错误的假设而导致的错误。偏差会导致数据拟合不足,高偏差意味着我们的学习算法缺少这些特征中的重要趋势。 方差与偏差不同。方差是指由于解决方案过于复杂而导致的错误。当模型尝试尽可能紧密地拟合训练数据时,就会发生这种情况。高方差会导致模型的预测值与训练数据集的实际值非常接近。该算法会复制训练数据的趋势,进而导致模型泛化。高方差会导致过度拟合。 在机器学习术语中,欠拟合意味着模型过于笼统,从而导致较高的偏差,而过拟合意味着模型过于具体,从而导致较高的方差。在训练模型时,重要的是要平衡这两者。由于你实际上无法完全避免偏差和方差,因此我们将其称为偏差方差权衡。

模型产生过拟合可能由于以下几种原因: 1.模型过于复杂 2.数据有噪声,即数据中存在异常值和错误 3.用于训练的数据量可能不够

预防模型过拟合的方法有: 1.交叉验证 2.训练更多数据 3.删除某些特征 4.正则化

收藏
2021-01-12 18:47 更新 Lisa •  1510