YOLOv3中anchor机制的理解

1、为什么要引入anchor机制?

如下图人和车的中心点都位于同一网格grid_8中,如果没有anchor机制的话,grid_8就存在属于哪一类的问题,如果属于车类,那只能用来预测车,人类就会被忽略,如果属于人类,那么车类将会被忽略。为了解决同一网络属于两个类的问题,引入了anchor机制,一个grid可以有三个anchor(对于yolo3),图中的紫色框为anchor,那么横着的anchor框就被用于预测车类,竖着的预测人类,从而解决了同一grid包含两类的问题。说白了,anchor就是来确认正负样本的,也就是样本的类别。

YOLOv3中anchor机制的理解

这个博客写的非常好,理解的很透彻,https://blog.csdn.net/weixin_43384257/article/details/100974776

2、YOLO3中grid cell理解。

yolo3中的grid cell 的数量根据三种预测尺度分别13x13,26x26,52x52(输入图像为416x416),每个grid cell根据3个anchor预测三个bbox, 每个bbox可以是不同的类。