过拟合与欠拟合的生动理解

1、过拟合

过拟合(OverFititing):太过贴近于训练数据的特征了,在对应训练集上表现非常优秀,近乎完美的预测/区分了所有的数据,但是在新的测试集上却表现平平。

讲一个故事来解释一下过拟合:
假如你在古代当官,你已经摸透了皇上的脾气,知道他讨厌别人文化比自己高,于是你每次写诗都写的很烂,皇上很中意你。
结果后来皇上gg了,太子登基,太子喜欢博学之士,但你还是像以前一样写些很烂的诗,于是你被罢官了,这就是过拟合。

过拟合就是在一个训练集上学得太好了,不管是通用技巧还是特殊情况全都学下来了,换了一个数据及后,那些学到的特殊情况就没用了

2、欠拟合

欠拟合(UnderFitting):样本不够或者算法不精确,测试样本特性没有学到,不具泛化性,拿到新样本后没有办法去准确的判断。

还是讲一个故事来解释一下:
假如你在古代当官,你没有摸透皇上的脾气,皇帝很讨厌你,卒。
这就是欠拟合。

3、图像表现

过拟合与欠拟合的生动理解
过拟合与欠拟合的生动理解

4、解决办法

解决过拟合的方法
降低数据量,正则化(L1,L2),Dropout(把其中的一些神经元去掉只用部分神经元去构建神经网络)

解决欠拟合的方法:增加训练数据,优化算法