Google Brain与牛津大学主持最新《计算机视觉前沿》报告 总结
相关介绍链接:http://www.sohu.com/a/257481590_297710
官方网站:http://www.deeplearningindaba.com/
该报告将ANN在CV的应用分为2大阶段,时间节点是2012年。Befrore 2012 and enter CNNs。
Before 2012,multi-step approach。该类主要是以编码的方式提取human engineered features。提取特征的出发点包括四个方面:
1. Histogram of image pixel intensities
2. Bag of Visual Words
3. Histogram of Oriented Gradients
两个阶段进行对比,则有
该报告中一个主要的观点是:While CNNs have provided stunning gains in accuracy, there appear to be other properties that are desirable to measure given a representation. Accuracy alone may not be sufficient. 为此,提出了其他指标作以辅助。
上述指标主要为AI界通识性的问题,具体可以解释如下:
问题是:Can we train more compact representations with comparable accuracy?
同时,报告指出了CV的关键挑战,
可以解释如下:
-Less progress as soon as task deviates from the ImageNet template
-Domain adaptation - training set is not representative of data in real life.
最后,贴上这一部分的总结
最后,说一下自己的感受,从PPT并未看出这份报告太有价值的部分,也有很大可能是没有听现场报告,所以觉得很空。
Ps: 一直以来想写Blog总结一下自己的收获,但是总感觉这是一件time-consuming的事情。所以,这篇处女座写的也很焦躁,希望自己一步步可以写出更好的内容。