长的短期记忆网络

RNN中参数就是W,需要学到的东西很多,W过载,只能记住最近的信息。

长的短期记忆网络

长的短期记忆网络

长的短期记忆网络

长的短期记忆网络

长的短期记忆网络

长的短期记忆网络

长的短期记忆网络

长的短期记忆网络

长的短期记忆网络

长的短期记忆网络

一个句子必不可少的操作就是分词,一直传递到最后,这就意味着最后的结果包含整个句子的信息。

LSTM的最后一个输出值作为多层神经网络的输入。。。。

长的短期记忆网络

长的短期记忆网络

长的短期记忆网络

长的短期记忆网络

长的短期记忆网络

长的短期记忆网络

长的短期记忆网络

CNN用于文本分类,需要进行一些妥协(因为一般的句子有时候长,有时候短,没法构造一个固定的图像,所以需要将输入变换为固定大小的---that's图像)

长的短期记忆网络

一维卷积---从上到下--逐次滑动。

长的短期记忆网络

长的短期记忆网络

长的短期记忆网络

长的短期记忆网络

长的短期记忆网络

CNN的卷积长度--相当于RNN中的N-gram。 

长的短期记忆网络