BMVC 2020 各奖项公布!最佳论文可能就是你要的涨点神器
BMVC 2020 已经闭幕,官方公布了5篇获奖论文,每篇都值得关注,本文就带领大家看看这些获奖论文研究内容是什么。
01
最佳论文奖
Delving Deeper into Anti-aliasing in ConvNets
作者 | Xueyan Zou, Fanyi Xiao, Zhiding Yu, Yong Jae Lee
单位 | UC Davis;英伟达
论文 | https://arxiv.org/abs/2008.09604
代码 | https://github.com/MaureenZOU/
Adaptive-anti-Aliasing
最佳论文研究的内容是卷积神经网络的的鲁棒性,提出了一种通用的网络反走样方法,显著改进了网络在图像分类、实例分割、语义分割等任务的精度。
对于CNN,众所周知的一大缺陷:即使图片移动几个像素都可能导致分类识别任务出现巨大的结果改变,对于号称超越人类识别能力的CNN来说这是不应该的,是什么造成这一问题的呢?其中重要原因是网络中的被大量的用来降低参数两的下采样层造成了图像边缘等高频信息的退化。
近年来一种改进的策略是在卷积层和下采样层之间加上高斯滤波,在一定程度上缓解了上述问题,但因为高斯滤波对特征层中各部分不加区别的处理,并不是最优的方案。
该文作者提出了一种根据特征层的内容在空间和通道级别进行可分离滤波的方案,在图像分类、实例分割、语义分割等任务中表现出了一致的性能改进,普遍涨点 1 个以上!
该模块方便插入现有CNN模型中,也许正是其对CNN各种应用都可能带来改进,所以赢得了评委的青睐!读者们不妨一试!
02
最佳论文提名奖
Key-Nets: Optical Transformation Convolutional Networks for Privacy Preserving Vision Sensors
作者 | Jeffrey Byrne, Brian Decann, Scott Bloom
单位 | Visym Labs;Systems & Technology Research
论文 | https://arxiv.org/abs/2008.04469
代码 | https://github.com/visym/keynet
备注 | BMVC 2020 Oral
这篇论文研究了一个很有意思的话题,如何在方便使用各种机器学习算法的同时保护内容隐私?表现在图像采集上,既然监控摄像头是为了进行各种任务的识别,让机器看懂就行了,它没必要保存人眼可见的内容。
于是,论文作者提出使用一种隐私保护的光学变换方法,将传感器采集的图片变成人眼不可“看懂”的数据,只有与其对应的Key-Net(这里是钥匙网络的意思)可以在此图像上进行算法推断识别。传感器处上锁、感知模块开锁。
看起来蛮有意思的,如果这种变换和相应网络能形成标准,在工业界可能更有意义,那些监控厂家应该对此会蛮有兴趣。
03
最佳学生论文奖
Video Region Annotation with Sparse Bounding Boxes
作者 | Yuzheng Xu, Yang Wu, Nur Sabrina binti Zuraimi, Shohei Nobuhara, Ko Nishino
单位 | 日本京都大学;
论文 | https://arxiv.org/abs/2008.07049
备注 | BMVC 2020 Oral
这篇论文研究的和数据标注相关。
深度学习对高质量的数据标注需求强烈,而密集的分割任务的标注是相当耗费人力的,如果是给视频进行像素级目标的标注那简直要人老命。
这篇文章就是希望解决视频中目标的像素级标注问题,标注员只需要在视频序列中划出稀疏的包围框。
作者发明了一种体积图卷积网络(VGCN)实现这一目标,该网络利用外观和运动信息的时空关系来迭代的找到区域边界上的关键点完成任务,而在视频序列中的全局进行优化,保证了其比之前的方案更好。
总之,这论文告诉我们该方案在视频目标像素级标注中很有用!不过很可惜,CV君没发现作者们提供工具,也没有开源代码。如果这样的工具可以被更多人获取,相信会有更多高质量视频标注数据,一定能促进视觉感知的技术进步。
04
最佳学生论文提名奖
Weakly-supervised Salient Instance Detection
作者 | Xin Tian, Ke Xu, Xin Yang, Baocai Yin, Rynson Lau
单位 | 大连理工大学;香港城市大学;鹏城实验室
论文 | https://www.bmvc2020-conference.com/assets/papers/0430.pdf
备注 | BMVC 2020 Oral
这是一篇作者全部来自国内的论文,研究内容是弱监督的显著实例分割,并称该文为此方向的第一篇论文。
弱监督大家并不陌生,在计算机视觉任务中往往指算法需要的标注信息很少且简单易获取,而显著实例分割则是将图像中显著目标个体像素级分割出来。该文使用的标签是目标类别和subitizing(物体个数)。
作者发明了一种含有边界检测、显著目标检测和质心检测三个分支的网络,尽管使用的标签没有像素级标注,依然取得了较好的分割效果,在主流数据集上提升[email protected] 将近 5 个百分点!
05
最佳工业论文奖
A CNN Based Approach for the Near-Field Photometric Stereo Problem
作者 | Fotios Logothetis, Ignas Budvytis, Roberto Mecca , Roberto Cipolla
单位 | Toshiba Europe Ltd;剑桥大学
论文 | https://www.bmvc2020-conference.com/assets/papers/0277.pdf
备注 | BMVC 2020 Oral
该文研究三维重建的问题,首次提出了一种CNN的方法用于近场目标的三维重建,在光线变化又反光的情况下表现出良好的适应性,在真实数据和模拟数据集上该方法均打败了之前的最好方法。
值得一提的是,这 5 篇论文中的三篇包括最佳论文的第一作者是华人,华人在计算机视觉领域真的贡献颇丰~
论文下载:
在OpenCV中文网公众号后台回复“BMVC2020”,即可收到所有论文下载。
备注:CV
计算机视觉交流群
扫码备注研究方向拉你入群。
OpenCV中文网
微信号 : iopencv
QQ群:805388940
微博/知乎:@我爱计算机视觉
网站:www.52cv.net
在看,让更多人看到