零基础入门NLP-新闻文本分类
1、TextCnn
TextCNN中采用的是一维卷积,每个卷积核的大小为\(h \times k\)(h为卷积核的窗口大小,k为词向量的维度),文中采用了多种不同尺寸的卷积核,用以提取不同文本长度的特征(上图种可以看见,卷积核有h=2, 3, 4三种)
1.1详细过程原理图
1.2 参数
Embedding方式、 卷积核大小、卷积核个数、**函数、Dropout、L2正则
2、TextRnn
TextRNN将Word Embedding输入到双向LSTM中,然后对最后一位的输出输入到全连接层中,在对其进行softmax分类