论文阅读笔记:A Unified Model for Opinion Target Extraction and Target Sentiment Prediction

  本文发表于AAAI2019,是由腾讯AI Lab主导,与香港中文大学合作完成,该研究通过改进基本的序列标注模型来提升端到端抽取用户评论中的意见目标和相应的情感倾向的性能。

摘要  

  基于意见目标的情感分析(TBSA)涉及到了意见目标抽取和目标情感预测两个子任务。目前的工作主要是将他们作为两个单独的任务来研究,对于实际应用的贡献是非常有限的。这篇文章的目标在于以一种端到端的方式来解决完整的TBSA任务。为了实现这个目标,本文提出了一个新的统一模型并在模型中采用了一种联合的标注方案。整个模型用到了两层循环神经网络(RNN):上层的RNN用来预测联合的标签,这些标签会作为主要任务TBSA的输出;为了引导上层的RNN更好的完成TBSA任务,本文引入了下层的RNN来同时解决辅助任务--意见目标实体的边界检测。RNN产生的边界特征表示可以直接用于提升目标情感预测的质量。为了探索任务之间的依赖,本文提出显式地对目标边界到目标情感极性的转换进行约束。本文也设计了一个组件对同一个意见目标内的情感一致性进行维持,这个组件主要基于门控制机制来对上一个时刻的特征和当前时刻的特征之间的关系进行建模。本文在三个标准数据集上进行了大量实验,结果表明本文的方法都比现有的方法更好。

Introduction
 

  基于目标的情感分析的任务时识别句子中提及的意见目标并预测其的情感极性,eg.“USB3 Peripherals are noticably less expensive than the ThunderBolt ones”,在这个句子中USB3 Peripherals和ThunderBolt ones是意见目标,对于这两个目标的机型分别是positive和negative。这个任务可以分成两个子任务:意见目标抽取(实体识别)和目标情感分类,有很多人的工作是针对其中一个子任务进行的。

  对于TBSA任务,也有一些人的工作是对整个任务进行的,常用的方法有两种:一种是对于两种子任务进行联合训练,如下图第一行所示,采用两套标注标签,(e.g., B, I, E, S and O)和(e.g. POS, NEG, NEU)其中BIESO分别表示target的开端,中间,结尾,单个词目标和没有情感,POS, NEG, NEU分别表示积极,消极和中性。另一种方法是忽略两个子任务的边界,用特殊设计的标签进行标注,B——{POS,NEG, NEU}, I——{POS, NEG, NEU}, E——{POS, NEG, NEU}, S——{POS, NEG, NEU},表示意义和上文一样。

论文阅读笔记:A Unified Model for Opinion Target Extraction and Target Sentiment Prediction

  在这篇文章中,提出一种模型采用统一的模型来解决TBSA任务,并在三个数据集上取得了优异的效果

Our Proposed Framework

Task Definition

这篇文章将TBSA任务看做一个序列标注任务,采用的标签如下:YS ={B-POS; I-POS; E-POS; S-POS; B-NEG; I-NEG; E-NEG;
S-NEG; B-NEU; I-NEU; E-NEU; S-NEU; O}.输入为论文阅读笔记:A Unified Model for Opinion Target Extraction and Target Sentiment Prediction输出为预测标注序列:论文阅读笔记:A Unified Model for Opinion Target Extraction and Target Sentiment Prediction

Model Description


  模型的整体结构如下图所示,有两个堆叠的LSTM和三个特殊设计的组件构成。三个组件分别为BG(边界引导):用边界信息辅助进行统一模型的标注,SC(情感一致性);多词组成的目标词应该具有相同的情感极性,OE(意见增强):目标词和情感词应该同时出现。

论文阅读笔记:A Unified Model for Opinion Target Extraction and Target Sentiment Prediction

Target Boundary Guided TBSA