Word2Vec（词向量）和文本分类（TextCnn）

Word2Vec（词向量)

详解我的博客: Word2Vec

TextCnn

TextCNN通过一维卷积来获取句子中n-gram的特征表示。TextCNN对文本浅层特征的抽取能力很强，在短文本领域如搜索、对话领域专注于意图分类时效果很好，应用广泛，且速度快，一般是首选；对长文本领域，TextCNN主要靠filter窗口抽取特征，在长距离建模方面能力受限，且对语序不敏感。

网络结构

Word2Vec（词向量）和文本分类（TextCnn）
TextCNN详细过程：

嵌入层(Embedding)：textcnn使用预先训练好的词向量作embedding layer,第一层是图中最左边的7乘5的句子矩阵，每行是词向量，维度=5，这个可以类比为图像中的原始像素点。
卷积(convolution)：然后经过 kernel_sizes=(2,3,4) 的一维卷积层，每个kernel_size 有两个输出 channel。
MaxPolling：第三层是一个1-max pooling层，这样不同长度句子经过pooling层之后都能变成定长的表示。
FullConnection and Softmax：最后接一层全连接的 softmax 层，输出每个类别的概率。

Word2Vec（词向量）和文本分类（TextCnn）