获取元组

获取元组

 

假设校长关系的一个迭代模式为“X#Ni校长/n#OY#Nh认为/v#O”,具体元组抽取方法如下:

(1)首先获取模式中的上下文,并将其组合在一起作为查询输入到搜索引擎。上面例子所构造的查询为“校长+认为”;(“校长*认为”),google通配符。

(2)从搜索引擎中获取包含所有上下文片段的句子。其中一个句子为:“美国耶鲁大学校长理查德·莱文认为一教学方法影响创新能力培养”;

(3)对保留下的句子进行分词,词性标注和NE识别处理.然后利用模式匹配分析后的句子,能够匹配的NE必须在位置、NE类型以及上下文都要和模式严格匹配。

 

美国耶鲁大学/ni#Ni校长/n#O理查德·莱文/nh#Nh认为/v#O-/m#Nm教学/n#O方法/n#O影响/v#O创新/v#O能力/n#O培养/v#O

 

上面的例子最终抽取出元组(美国耶鲁大学,理查德·莱文)。依此方法,可以从实例集合中抽取出多个元组。

 


获取元组
 

 

参考:基于网络挖掘的实体关系元组自动获取