NLP10-SGM-论文学习笔记

论文题目：SGM: Sequence Generation Model for Multi-Label Classification

发表期刊：2018-Coling Bestpaper

多标签分类：The target of the MLC task is to assign multiple labels to each instance in the dataset

1、相关工作

将多标签分类问题看做是一个链式的二分类问题

NLP10-SGM-论文学习笔记

也采用了序列生成的方式，但没有采用注意力机制，获得的提升有限，原因值得思考

NLP10-SGM-论文学习笔记

NLP10-SGM-论文学习笔记

NLP10-SGM-论文学习笔记

Encoder采用双向LSTM，Decoder采用LSTM，结合了注意力机制，采用序列生成的方式预测多个标签
标签处理：根据出现频率对标签进行排序，高频的标签放在前面【出现次数多的为大类的概率更大】
mask softmax：预测过的标签不再重复预测
global embedding：将所有标签信息的embedding融合得到全局的embedding
Decoder【LSTM】接收上一时刻(t-1)decoder的隐藏状态S(t-1)、上下文向量 Ci 和 GE 作为输入，产生时刻t的隐藏状态，最后通过softmax层达到标签的预测。
文本序列Xi是一句话中的m个词通过词嵌入的方式获得的词向量