线性回归中的过拟合以及欠拟合
分类:
文章
•
2024-09-26 23:28:22
过拟合以及欠拟合
假如把天鹅的特征设置为 (嘴巴长,脖子长且弯曲,有翅膀),那么在预测时 就将黑天鹅区别为不是天鹅 此现象为过拟合
假如把天鹅特征设置为(嘴巴长,有翅膀),那么预测时会将一些鸟类动物区分为天鹅,此现象为欠拟合
根据结果现象判断过拟合还是欠拟合
当对结果进行交叉验证时 训练集和测试集结果表现都不行 则为欠拟合 当训练集结果大于预测集,,推测可能是特征过于复杂,则为过拟合
欠拟合原因以及解决办法
原因:学习到数据的特征过少
解决办法: 增加数据的特征量
过拟合原因以及解决办法
原因: 原始特征过多,存在一些嘈杂特征,模型过于复杂是因为模型尝试去兼顾各个数据点
解决办法:1, 进行特征选择,消除关联性大的特征(较为困难)
2,交叉验证(让所有数据都有过训练)
3,正则化
线性回归LinearRegression 为了把训练集数据表现更好 因此会出现过拟合
L2正则化:Ridge 岭回归 带有正则化的线性回归