Datawhale 零基础入门CV-Task4 模型训练与验证

学习目标

  1. 理解验证集的作用,使用训练集和验证集完成训练
  2. 学会使用Pytorch环境下的模型读取和加载,并参与调参流程

构造验证集

模型训练过程中,只能在训练集上训练,不能接触测试集的样本。容易造成过拟合。
Datawhale 零基础入门CV-Task4 模型训练与验证
我们可以在本地构建自己的验证集进行本地测试。

  1. 训练集:模型用于训练和调整模型参数
  2. 验证集:验证模型精度和调整模型超参数
  3. 测试集:验证模型泛化能力

几种构建验证集的方法:

  1. 留出法
    用于数据量较大的情况。
  2. 交叉验证法
    将训练集划分为K份,K-1为训练集,1为验证集。循环训练。缺点:不适用于数据量很大的情形。
  3. 自助采样法
    通过有放回的取样方式得到验证集与训练集。一般用于数据量较小的情况。

模型调参流程

  • 初步构建简单CNN模型,跑通模型。
  • 增加模型复杂度,观察验证集的情况。
  • 增加模型复杂度的同时增加数据扩增,直到验证集精度不变。