莫烦视频笔记--什么是自编码(Autoencoder)?神经网络的非监督学习

莫烦视频笔记--什么是自编码(Autoencoder)?神经网络的非监督学习

自编码是一种神经网络形式,可以这样理解:有一个神经网络,它要做的是接收一张图片,然后给它打码,最后再从打码后的图片还原,太抽象了,再具体一点。

莫烦视频笔记--什么是自编码(Autoencoder)?神经网络的非监督学习

假设刚刚的神经网络是这样,对应上刚才的图片,我们可以看出图片是经过了压缩再解压的这一套工序。当压缩的时候,原有的图片质量被缩减,解压的时候,用信息量小、却包含了所有关键信息的文件恢复出原有图片。

莫烦视频笔记--什么是自编码(Autoencoder)?神经网络的非监督学习

为什么要这样做呢?有时神经网络要接受大量的输入信息,比如输入信息是高清图片的时候,输入信息量可以达到上千万,让神经网络直接从上千万个神经元学习是一件非常吃力的工作,所以何不压缩一下呢,提取中原图片中最具代表性的信息,压缩输入的信息量,再把缩减过后的信息放入神经网络中学习,这样学习起来就变得轻松了,所以自编码就能在这个时候发挥作用。

莫烦视频笔记--什么是自编码(Autoencoder)?神经网络的非监督学习

通过将原数据白色的X压缩解压成色的X,然后通过对比黑白X求出预测误差,进行反向传递,逐步的提升自编码的准确性,训练好的自编码也就是中间的这一部分能够总结出原数据的精髓。可以看出,从头到尾,我们只用到了输入信息X,并没有用到输入X对应的标签,也可以说自编码是一种非监督学习。但是真正使用自编码的时候,通常只会用到自编码的前半部分,这个部分也叫做encode编码器,编码器能得到原数据的精髓,然后我们只需要再创建一个小的神经网络学习这个精髓的数据,不仅能减少神经网络的负担,同样能达到很好的效果。

莫烦视频笔记--什么是自编码(Autoencoder)?神经网络的非监督学习

这是一个通过自编码整理出来的数据,它能从原数据中总结出来每种类型数据的特征。如果把这些特征类型都放在一张二维的图片上,每种类型都已经被很好的用原数据的精髓区分出来,如果你了解PCA主成分分析在提取主要特征时,自编码和它一样甚至超越了PCA,换句话来说,自编码像PCA一样,给特征属性降维。