Mosaic数据增强

YOLO V4 ——tricks
增强方式很简单，就是将四张图片拼成一张图片。
优点：

改进SAM

YOLO V4 ——tricks
以前的空间注意力都是用一个maxpooling和averapooling拼接在一起的得到的，这里使用的是直接用卷积得到的。
不知道为何这样做，好处是什么~

改进PAN

YOLO V4 ——tricks
原来的PAN是不同层相加特征相加，这里改成了乘。
同样不知道为啥~

Label Smoothing

标签平滑，就是经过one-hot原来是正样本应该是1负样本应该是0，现在让正样本变得小一点，负样本大一点。
YOLO V4 ——tricks
优点：
1)无法保证模型的泛化能力，容易造成过拟合。
2) 全概率和0概率鼓励所属类别和其他类别之间的差距尽可能加大，而由梯度有界可知，这种情况很难适应。会造成模型过于相信预测的类别。

余弦退火学习率

YOLO V4 ——tricks
在传统的学习率的设定是，随着迭代次数的增大，所以模型逐渐找到局部最优点。这个过程中，因为一开始的学习率较大，模型不会踏入陡峭的局部最优点，而是快速往平坦的局部最优点移动。随着学习率逐渐减小，模型最终收敛到一个比较好的最优点。
余弦退火学习率模型会迅速踏入局部最优点（不管是否陡峭），并保存局部最优点的模型。保存模型后，学习率重新恢复到一个较大值，逃离当前的局部最优点，并寻找新的最优点。因为不同局部最优点的模型则存到较大的多样性，所以集合之后效果会更好。
YOLO V4 ——tricks