yolov3训练过程中输出参数详解

yolov3训练过程中输出参数详解
Region 16, Region 20表示两个不同尺度上检测的结果。
16卷积层为最大的预测尺度, 可以预测出较小的物体;
20卷积层为最小的预测尺度, 可以预测出较大的物体。

我们发现每次迭代都有两组Region 16, Region 20。
因为在darknet中,所有训练图片中的一个批次(batch)又被分成subdivision份来进行计算,而该训练过程 .cfg 文件中设置的batch=32,subdivisions=2,所以就有两组Region 16, Region 20,每组中用到了16张图片。

Region xx Avg IOU: 表示在当前subdivision内的图片的平均 IOU(预测的矩形框和真实目标的交集与并集之比);越大越好,最大为1。
Class: 标注物体分类的正确率;越大越好,最大为1。
Obj:越接近 1 越好;
No Obj:期望该值越来越小, 但不为零;
.5R:以与ground true的iou大于0.5为正样本时的recall/count,是当前模型在所有 subdivision 图片中检测出的正样本与实际的正样本的比值。全部的正样本被正确的检测到应该是1。
.75R:以与ground true的iou大于0.75为正样本时的recall/count。
count:所有当前 subdivision 图片(本例中一共 16张)中包含正样本的图片的数量。

用红色框框住的一行参数的含义为:

  • 当前训练的迭代次数
  • 总体的 Loss(损失)
  • 平均 Loss, (一般这个数值低于 0.060730 avg 就可以终止训练了)
  • 当前的学习率
  • 当前批次训练花费的总时间
  • 表示到目前为止, 参与训练的图片的总量;等于batch迭代次数*batch