零基础入门NLP-新闻文本分类

1、TextCnn

零基础入门NLP-新闻文本分类

TextCNN中采用的是一维卷积,每个卷积核的大小为\(h \times k\)(h为卷积核的窗口大小,k为词向量的维度),文中采用了多种不同尺寸的卷积核,用以提取不同文本长度的特征(上图种可以看见,卷积核有h=2, 3, 4三种)

1.1详细过程原理图

零基础入门NLP-新闻文本分类

1.2 参数

 Embedding方式、 卷积核大小、卷积核个数、**函数、Dropout、L2正则

2、TextRnn

零基础入门NLP-新闻文本分类

TextRNN将Word Embedding输入到双向LSTM中,然后对最后一位的输出输入到全连接层中,在对其进行softmax分类