Task4 基于深度学习的文本分类1-fastText

FastText

FastText是一种典型的深度学习词向量的表示方法,它非常简单通过Embedding层将单词映射到稠密空间,然后将句子中所有的单词在Embedding空间中进行平均,进而完成分类操作。
所以FastText是一个三层的神经网络,输入层、隐含层和输出层。

下图是使用keras实现的FastText网络结构:
Task4 基于深度学习的文本分类1-fastText

FastText在文本分类任务上,是优于TF-IDF的:
Task4 基于深度学习的文本分类1-fastText

FastText用单词的Embedding叠加获得的文档向量,将相似的句子分为一类FastText学习到的Embedding空间维度比较低,可以快速进行训练