Datawhale 零基础入门CV-Task4 模型训练与验证
学习目标
- 理解验证集的作用,使用训练集和验证集完成训练
- 学会使用Pytorch环境下的模型读取和加载,并参与调参流程
构造验证集
模型训练过程中,只能在训练集上训练,不能接触测试集的样本。容易造成过拟合。
我们可以在本地构建自己的验证集进行本地测试。
- 训练集:模型用于训练和调整模型参数
- 验证集:验证模型精度和调整模型超参数
- 测试集:验证模型泛化能力
几种构建验证集的方法:
- 留出法
用于数据量较大的情况。 - 交叉验证法
将训练集划分为K份,K-1为训练集,1为验证集。循环训练。缺点:不适用于数据量很大的情形。 - 自助采样法
通过有放回的取样方式得到验证集与训练集。一般用于数据量较小的情况。
模型调参流程
- 初步构建简单CNN模型,跑通模型。
- 增加模型复杂度,观察验证集的情况。
- 增加模型复杂度的同时增加数据扩增,直到验证集精度不变。