数据挖掘-之-面试-过拟合-欠拟合

拟合
我们在进行·计算时,都会得到一个实际的操作值,也就是实际值,我们设为x,其次有一个是函数的真实值,我们设定为y,我们通过自己是假设一个函数f来进行计算求解得到x,最终目的就是希望x与y尽可能地接近,如果他们之间越接近就说明设定的函数越好,模型越优秀效果越好。因此,这里的拟合,就是一个x与y之间是否无限接近的一个状态。

因此拟合,会存在这样的三种状态:过拟合,欠拟合,刚刚好。(怎么样,是不是已经有感觉了)。

如图所示:(别人那儿找的一些图)
数据挖掘-之-面试-过拟合-欠拟合
欠拟合:
模型表现太差,可能是获取的特征太少,模型无法很好地匹配,存在理解不狗透彻这样的一种转态。

过拟合:就是对于某一类的特征过于细化,表现过好,这样模型就会缺少泛化能力,不能够很好地适用于其他特征,过于特殊化,