交叉验证(CV)方法的步骤
做数据训练的时候,常常为了是模型具有更好的泛化能力,通常会使用交叉验证的方法,简单介绍一下他是如何工作的。
作用:交叉验证的方法是为了为模型挑选出最为合适的参数,使得模型的性能和泛化能力更强。
k折交叉验证(n-fold cross validation)
伪代码:
循环n次
每次循环:
给出随机或者确定的参数列表
对每一个/组参数求模型的loss
选取使loss最小的一个/组数据
对n个求得的参数取平均,即为得到该模型的最终参数
在进行正常训练即可。
因为k折交叉验证要将一个数据集运行k次,所以它适用于数据集不大的时候更适合用。