论文解读:BS-Nets: An End-to-End Framework For Band Selection of Hyperspectral Image
BS-Nets: An End-to-End Framework For Band Selection of Hyperspectral Image
选用波段选择的原因:保留了包含在HSI中的主要物理属性,鲁棒性强。
波段选择分为有监督和无监督:无监督又可分为基于排序和基于聚类。基于排序的无监督波段选择方法主要是根据某个度量准则来评价每个波段的重要性,如非高斯度,方差,互信息等;基于聚类的无监督波段选择方法以最小化类内的方差,最大化类间的方差为目标将波段分成不同的类,然后在每个类中选择出聚类中心作为最有代表性的波段,达到了去除波段间冗余性的目的。
基于聚类的有子空间聚类(ISSC)和稀疏非负矩阵分解聚类(SNMF)
基于排序的最大方差主成分分析(MVPCA,稀疏表示(SpaBS)和基于几何的波段选择(OPBS)等等。(PS:之所以提到是因为后面的对比算法用到了。)
本文成立的条件是:假设光谱波段可以用少量的信息波段进行稀疏重建。
本文的贡献:
1): 提出了一种基于深度神经网络的端到端波段选择框架,用于学习光谱波段之间的非线性相关性。
2) 我们根据不同的应用场景实现了两个不同的BS-Net,即基于频谱的BSNet-FC和基于频谱空间的BS-Net-Conv。
3) 我们从分类性能和定量评估等方面对拟议的BS-Nets框架进行了广泛的评估,表明BS-Nets可以实现最新的结果。
本文的重点或许就是这个了:
Attention Mechanism:注意力被定义为一种使可用处理资源的分配偏向于输入信号的信息量最大的方法。文中虽然这样说,但是最好的理解方式就是,当我们去看某个东西的时候,我们会更关注我们关心的东西,而忽略其他次要的。
其中ω可以是表示某个输入的重要性的矩阵或向量。attention的实现一般由一个门控功能(如Sigmoid或Softmax)组成,并结合多层非线性特征变换。
注意力机制分为三类,空间注意力,通道注意力,通道注意和空间注意的结合。对于HSI波段选择任务,目标是更加关注那些信息波段,并且避免琐碎波段的影响本,因此本文使用的是通道注意力。
BS-Nets:
BS-Nets的关键是将频带选择转换为稀疏频带重建任务,即使用一些信息频带恢复完整的频谱信息。框架总体架构如图:
该架构包括三个组件:频带关注模块(BAM),频带重加权(BRW)和重建网络(RecNet)。BAM是一个分支网络,使用它来学习频段权重。BAM直接将HSI作为输入,旨在完全提取频谱带之间的相互依赖性。BAM产生一个非负的带权张量w,为保证所学权值的非负性,采用Sigmoid函数对BAM中的输出层进行**。
所谓的BRW就是讲原始HIS与BAM的输出进行band-wise(有点像像素点的element-wise、add、concat)。
在下一步,使用RecNet恢复原始光谱波段从重新加权对应。类似地,我们将RecNet定义为一个函数f,它以一个重新加权的张量z作为输入和输出它的预测。并且使用均方误差(MSE)度量重构性能
此外,使带权值尽可能稀疏,这样可以更容易地解释它们。为此,对带权施加L1范数约束。
根据学习到的稀疏频带权值,我们可以对所有训练样本的频带权值进行平均来确定信息频带。计算第j波段的平均权值,那些平均权重较大的波段被认为是有意义的,因为它们对重建的贡献较大。伪代码如图:
BS-Net-FC:在BS-Net-FC中,我们使用光谱向量(像素)作为训练样本。
在这里插入图片描述
在图3(a)中,我们展示了基于完全建模光谱信息之间的非线性关系的BS-Net的第一种实现。 在这种情况下,BAM和RecNet都通过完全连接的网络实现,因此我们将此BS-Net称为BS-Net-FC。
如图3(a)所示,BAM被设计为具有多个完全连接的层的瓶颈结构,所有中间隐藏层都具有ReLu**。根据信息瓶颈理论,尽管BS-Net中允许使用不同的结构,但瓶颈结构将有利于信息的提取。PS:所谓的bottleneck structure。其实是指下图的。直观的理解是这玩意儿应该是用来降维用的
BS-Net-Conv:代替使用单个像素,BS-Net-Conv采用3-D HSI patches,其中包括频谱和空间信息作为训练样本。
在BS-Net-FC中进行训练时,仅考虑频谱信息。缺少对空间信息的考虑将导致低效率地使用HSI中包含的频谱空间信息。 为了增强BS-Net-FC,我们通过使用卷积网络(称为BS-Net-Conv)来实现第二个BS-Net。实现的示意图在图3(b)中给出。
在BAM中,我们首先采用几个2-D卷积层同时提取光谱和空间信息。 然后,使用全局池化(GP)层来减少生成的特征图的空间大小。 最后,最终的频带权重W由几个完全连接的层生成,并用于对频谱带进行加权。 BS-Net-Conv采用卷积-反卷积网络(Conv-DeConv Net)来实现RecNet。 与经典的自动编码器类似,Conv-DeConv网络包括一个提取深度特征的卷积编码器和一个对特征图进行上采样的反卷积解码器。
为了生成足够的训练样本,我们使用大小为a×a的矩形窗口以跨度t在给定的HSI上滑动。请注意,BS-Net-Conv中的训练样本数量少于BS-Net-FC中的训练样本数量。
实验部分:
数据集:Indian Pines, Pavia University, and Salinas。
对于每个数据集,首先通过分析训练损失,分类准确性和带权重来研究模型收敛性。 接下来,我们将BS-Nets的分类性能与许多现有的频带选择方法进行比较,例如ISSC,SpaBS,MVPCA,SNMF,MOBS和OPBS。
使用径向基函数核的支持向量机作为分类器来评价所选波段子集的分类性能。从每个数据集中随机抽取5%的标记样本作为训练集,其余样本作为测试集。通过对每种BS方法进行20次独立运行的评估,计算出总体精度(OA)、平均精度(AA)和Kappa系数(Kappa)。
为了定量分析选定的波段子集,计算了波段子集的熵和平均光谱散度(MSD)。
熵越大,则该频带所包含的图像细节越多。MSD值越大,所选频带之间的冗余度越小。