Listwise View Ranking for Image Cropping论文理解

论文针对图片裁剪中的排序问题和形变问题提出了解决方案。

Listwise View Ranking for Image Cropping论文理解

  1. 数据(文章或图片)转换为特征向量,作为待排序的对象——object。
  2. pointwise  以单个object作为排序的对象。通过机器学习方法获得针对每个object的分类或回归(排序)模型,当输入新object时,模型的预测结果即为排序结果;
  3. pairwise    以两个object的组合作为排序对象。通过网络学习输入中相关的任意两object组合的排序模型,以此获得结果中不同object的先后顺序;
  4. listwise    将所有object的组合作为排序对象。直接对查询结果的所有object进行排序。
  5. 总结:单文档方法将训练集里每一个文档当做一个训练实例,考虑的是全局性,忽略了结果的先后顺序;文档对方法将同一个査询的搜索结果里任意两个文档对作为一个训练实例,考虑的是文档对的先后顺序,忽略了结果中整体的先后顺序;ListWise方法直接考虑整体object,针对Ranking评价指标进行优化。
  • Listwise View Ranking 
  1. Plackett-Luce模型 将object的排序方式转换为单一的概率值。如下所示,式子(1)中s表示所有object的得分,π为排序结果共n个,j和k表示第j个或第k个排序结果,Listwise View Ranking for Image Cropping论文理解表示当前排序的概率值,Listwise View Ranking for Image Cropping论文理解表示第j个排序位置的得分,Listwise View Ranking for Image Cropping论文理解函数为单调递增且值域大于零的函数。    式子(2)表示第j个object为第一个排序结果的概率定义;式子(3)表示第j个object为top1的概率值。

Listwise View Ranking for Image Cropping论文理解

  1. Plackett-Luce模型示例,排序结果π和得分结果S_true的相对顺序一致时,其概率更高些。

Listwise View Ranking for Image Cropping论文理解

  1. 将标注的排序方式的概率与预测预测的概率值利用交叉熵计算损失值。

Listwise View Ranking for Image Cropping论文理解

  • ROIRefine 结合RoIAlign和RoIWarp两种方式的结果,即先参考RoIAlign池化坐标点的生成方法,采用双线性插值的方法获得浮点数位置的像素值,crop出当前RoI区域;然后参考RoIWarp将roi区域变为固定分辨率的方法,将crop区域利用双线性差值的方法warp为14*14的大小。最后对插值后的区域进行池化操作。论文中指出,第二次插值为固定大小的区域是为了解决feature map和候选结果的不一致性。   RoIAlign可以移步这里查看。

Listwise View Ranking for Image Cropping论文理解

参考文献:

  1. Listwise View Ranking for Image Cropping
  2. Learning to rank基本算法小结

  3. Learning to Rank学习笔记--ListwiseRank

  4. ROI Align 解析

  5. Understanding Region of Interest — (RoI Align and RoI Warp)