线性回归中的过拟合以及欠拟合

过拟合以及欠拟合

线性回归中的过拟合以及欠拟合

假如把天鹅的特征设置为 (嘴巴长,脖子长且弯曲,有翅膀),那么在预测时 就将黑天鹅区别为不是天鹅 此现象为过拟合

假如把天鹅特征设置为(嘴巴长,有翅膀),那么预测时会将一些鸟类动物区分为天鹅,此现象为欠拟合

线性回归中的过拟合以及欠拟合

根据结果现象判断过拟合还是欠拟合

当对结果进行交叉验证时 训练集和测试集结果表现都不行 则为欠拟合 当训练集结果大于预测集,,推测可能是特征过于复杂,则为过拟合

欠拟合原因以及解决办法

原因:学习到数据的特征过少

解决办法: 增加数据的特征量

过拟合原因以及解决办法

原因: 原始特征过多,存在一些嘈杂特征,模型过于复杂是因为模型尝试去兼顾各个数据点

解决办法:1, 进行特征选择,消除关联性大的特征(较为困难)

2,交叉验证(让所有数据都有过训练)

3,正则化

线性回归LinearRegression 为了把训练集数据表现更好 因此会出现过拟合

L2正则化:Ridge 岭回归 带有正则化的线性回归

线性回归中的过拟合以及欠拟合线性回归中的过拟合以及欠拟合

线性回归中的过拟合以及欠拟合