摘要：

作者提出了一种根据预测难度自动调整cross entropy比例的loss。

在预测结果中，我们只会选择最高置信分作为输出，而不会考量这个目标本身的预测难度。本文的思想是根据正样本与负样本的预测分值的gap，做为预测难度属性，结合难度属性的信息动态的调整loss的比例。

作者主要在分类网络和人体姿态估计网络中试验了这种方法，都取得了不错的效果。

简介

Anchor Loss论文学习是anchor probability，anchor loss会参考来评价背景类别(不是目标的类别都是背景类别)的难易程度。如果背景类别的分值大于，则认为这个背景类别为难学，如果背景类别的分值小于，则认为这个背景类别容易学。

这里 Anchor Loss论文学习一般会使用正确类别的预测分值。

Anchor Loss论文学习

因为左右身体的对称性，网络常常很难区分左右，或者说网络对于相似的物体比较难区分。虽然在正确类别上的分值可能也不低，但是最终会取最高的分值，可能导致预测错误。AL就是要对类别预测错误，并且有比较高的分值时，给更多的惩罚。左图如果背景倍识别为某个类别，AL与CE的比较曲线。可以看出当预测分值大于0.5后loss会很快的增加，这样对于预测错误的高分值有很快的抑制作用。

Anchor Loss论文学习

a.C1是正确的类别，C1预测的分值为0.1，如果其他类别预测的分值高于0.1，可以看到anchor loss方法会有更快上升的惩罚。

b.C1是正确的类别，C1预测的分值为0.5，如果其他类别的预测分值小于0.5，anchor loss会比较小，而如果其他类别的预测分值大于0.5，anchor loss的值会非常快速上升。

c.C1是正确的类别，C1预测的分值为0.9，表示现在这个sample学习的不错，anchor loss的曲线与cross entropy基本一致。

本文本文的主要贡献是：

I.提出了一种新颖的anchor loss用于图像分类

II.将anchor loss应用在了人体姿态识别上

III.比较了anchor loss与其他loss的区别

IV.实验体现了anchor loss在分类任务和人体姿态识别任务上的效果

方法介绍

Anchor Loss

Anchor Loss论文学习

1.p为标签值，为0 或者1，anchor loss只会改进负样本的计算，所以这里p为0才会生效

2.q为当前这个类别的预测值，因为是负样本，所以希望q越小越好

是正确类别的预测值

4.gamma是超参数

if q >

表示预测错误的类别分值大于预测正确类别的分值，需要加大惩罚，所以modulator的值会大于1

if q =

表示预测错误的类别等于预测正确类别的分值，此时会等同于CE loss

if q <

表示预测错误的类别分值小于预测正确类别的分值，表示预测正确，因为modulator的值会小于1

分类网络的应用

为了应用AL，这里会使用sigmoid-binary cross entropy作为基础loss。sigmoid-binary cross entropy loss是用来做多标签识别任务，可以判断一张图片中有哪些物体，将每个类别作为二分类进行学习。

Anchor Loss论文学习

K代表类别数，是K个二分loss的相加;

代表k类别的标签，

代表k类别的预测值;

-delta，t代表 Anchor Loss论文学习

=1对应的index，delta=0.05，就是说 Anchor Loss论文学习

代表正样本的分值。增加delta是为了考虑当正负样本分值一样的时候增加一点惩罚。

Anchor Loss论文学习

比如上面这个例子，如果按照公式计算，class1就是简单案例，负样本前的权重不考虑delta是1+0.25-0.75=0.5.class2是临界值的例子，这里会增加一个delta微微增加惩罚，所以前面的权重是1.05.class3和class4就是难例，不考虑delta的话前面的权重是1+0.75-0.25=1.5，1+0.9-0.1=1.8.显而易见，对难例增加了惩罚。