【论文研读】Relation Classification via Convolutional Deep Neural Network
核心: 用卷积神经网络提取词语和语句级别的特征,将所有的单词标注作为输入(无预处理操作)。通过word embedding将单词标记转换为向量,根据给定的名词提取词汇级别的特征,同时使用卷积神经网络学习语句级特征。连接两个级别的特征形成最终特征向量,最后将其输入softmax分类器预测两个标记名词之间的关系。
整体框架: 主要包括三个组件:单词表示,特征提取和输出。(Word
Representation, Feature Extraction and Output)系统的输入是带有两个标记名词的句子。然后,通过查找单词嵌入(word embeddings)将单词标记转换为向量。然后分别提取词法和句子级别特征,然后直接连接以形成最终特征向量。最后,为了计算每个关系的置信度,将特征向量馈送到softmax分类器中,分类器的输出是向量,其维度等于预定义关系类型的数量,每个维度的值是对应关系的置信度得分。
单词表示: 通过查找单词嵌入将每个输入单词标记变换为向量。
词汇级别特征: 本文使用通用字嵌入(generic word embeddings)作为基本特征的来源,选择标记名词的嵌入和上下文标记。
语句级别特征: 使用最大池卷积神经网络以提供语句级别表示并自动提取语句级别的特征。 下图显示了提取语句级别特征的框架。
单词特征: 在相同语境中出现的单词往往具有相似含义,因此将单词的矢量表示和单词的矢量表示结合在其上下文中。
标记的名词与标签 相关联,标签 定义标记的对包含的关系类型。每个单词与单词嵌入的索引相关联。 然后将句子 的所有单词标记表示为向量列表,其中对应于句子中第 个单词的单词嵌入。表示上下文大小,例如取w = 3时,句子 中第三个单词 moving 的 表示为。整个句子表示为:
位置特征: 表示当前单词与和的相对距离的组合。 例如,句子中moving到people和downtown的相对距离分别为3和-3。 在本文的方法中,相对距离也被映射到维度(超参数)的向量,该向量是随机初始化的。 然后获得关于当前字与和的相对距离的距离矢量和,并且。 结合和,该字表示为,其随后送到算法的卷积分量中。