机器学习系列文章(监督学习):回归

在机器学习领域,最神奇的模型当属回归模型,回归模型也是非专业人员一谈机器学习就能无意涉及到的内容。在这里,笔者先谈谈当前信息学科被无良媒体夸大报道赚取点击率关注度的商业行为。不知何时起,国民自负的以为手里拿着手机,包里背着笔记本就以为掌握了信息时代发展的最前沿信息。这种不理性的行为,除了为你赚取一点跟你一样自负人的谈资外,一无所获。另一方面,当一项新的互联网技术取得了突破性成果后,无良媒体疯狂炒作概念,引诱用户群体关注。所以希望我们每个专业和非专业人士都能时刻保持理性,正确看待技术革新。避免再次出现,‘区块链养猪’,‘区块链种菜’ 等笑料。

回归模型通过多项式插值的方式学习一个能够拟合采样数据的多项式数值函数。通过这个一般的多项式函数,预测未来数据在这个多项式函数中的走势。进而,达到预测的目的。

--回归模型理论解释

在机器学习中,函数是未知的,不过我们有从其中抽取的训练集。

机器学习系列文章(监督学习):回归

机器学习系列文章(监督学习):回归

机器学习系列文章(监督学习):回归

机器学习系列文章(监督学习):回归

机器学习系列文章(监督学习):回归

 

--总结

从上述概念不难看出,回归的主要任务是找出能够拟合训练数据集的数值函数,从而得到数据中的经验,为该问题数据的一般化建立模型。上述步骤总结如下:1、假定多项式函数(这里可以用交叉验证技术,进行多项式回归阶数的选取)  2、定义训练集上的误差函数  3、用训练集不断优化多项式函数求得多项式系数。

 

参考:机器学习导论