[论文笔记]Cognitive Psychology for Deep Neural Networks: A Shape Bias Case Study

研究背景

神经网络的可解释性逐渐成为研究热点,本文的研究人员认为神经网络决策过程与人类认知过程也许有相似之处,并利用已经提出的人类认知过程假设来研究神经网络的决策过程。

主要贡献

  • 本文从量化角度证明了神经网络识别时更偏好于识别形状而非颜色。
  • 证明这种偏差在同结构但不同初始化的网络中存在极大差异,并且和分类正确率无关。引申结论即为不同初始化的网络具有不同的决策过程,即使分类正确率类似。(笔者认为类似于1000个人眼里有1000个哈姆雷特)

研究方法

1、假设验证

本文采用认知心理学中常用的一种实验方法,假设验证,即首先提出针对人认知过程的特点(如看物体的时候是看颜色还是看形状)的假设,后根据假设设计实验进行验证。本文利用该方法的优点在于认知心理学的研究中的假设已经很多,并且看起来都有理有据,只需要验证这些假设是否在神经网络中成立即可。

2、单样本学习(one-shot learning)

本文利用单样本学习进行实验。文中方法为给已经训练好的神经网络一个新的样本(probe image),观察网络将其分为已学习类别(support set)中的哪一类。其基础为默认神经网络学习到了support set中图片的特征,那么在学习新样本时便能根据特征相似度进行分类。
[论文笔记]Cognitive Psychology for Deep Neural Networks: A Shape Bias Case Study
x^\widehat {x}y^\widehat {y}代表新的图片和类别。分类的依据为新样本特征向量与support set中距离最近的样本,这里的距离可以为欧氏距离或余弦距离,结果类似。

3、数据集

作者使用了两个数据集,Cognitive Psychology Probe Data(CogPsyc data),共有150张图片,其中每三张为一组,包含新样本图片,和新样本颜色一致但形状不同的图片以及和新样本形状相同但颜色不同的图片。第二个数据集为作者自己搜索制作的,包含30对如上所述图片。图片对释义如下,最左为颜色不同,中间形状不同,最右为待分类物体。最左和中间图片共同构成support set。
[论文笔记]Cognitive Psychology for Deep Neural Networks: A Shape Bias Case Study

4、衡量指标

作者提出一种衡量指标来量化针对形状的偏好。
[论文笔记]Cognitive Psychology for Deep Neural Networks: A Shape Bias Case Study
其中,δ\delta代表狄拉克函数。E为期望。ysy_s为形状类似图片的标签。越高代表形状喜好越强烈。结果小于0.5代表偏好颜色,反之则代表偏好形状。

实验和结果

作者在Inception网络和Matching Net网络进行了实验。由于Matching Net对结论影响不大,故不做记录。

1、BsB_s在Inception网络的结果

在CogPsyc上,BsB_s结果为0.68,而作者构建数据集上BsB_s为0.97。可见在关注新样本时,网络更偏向于关注其形状。

2、不同初始化的网络的BsB_s差异很大

[论文笔记]Cognitive Psychology for Deep Neural Networks: A Shape Bias Case Study
作者发现,对于随机初始化的网络,BsB_s的数值在每次初始化后都有较大差异。上图黄线为15个随机初始化的Inception网络在训练过程中的BsB_s结果,红蓝线为强调。

3、BsB_s和分类正确率不线性相关

通过相关系数计算,作者发现BsB_s和分类正确率之间的相关系数在CogPsyc data上为0.15,构建数据集上为-0.22,代表BsB_s的波动和分类正确率无线性关系。

结果讨论

本文虽然发现了神经网络决策过程的一个特点,但是并未解释为什么会产生这种形状偏差的特点(文中作者承认)。[论文笔记]Cognitive Psychology for Deep Neural Networks: A Shape Bias Case Study
但是,笔者认为这种借鉴认知科学研究方法来研究深度学习,尤其是神经网络的过程值得借鉴。神经网络是模仿人类神经元建造的,但目前无论是计算复杂度(加和、**)还是连接方式,亦或是利用数据的方式(图片所有像素),都与生物神经元存在较大区别。因此,借鉴认知科学,或脑科学的知识,相信研究者们能更深层次理解神经网络,从而改善其结构、计算过程,让其不仅性能良好,并且不再是一个黑盒。