将复合句子与多个主题分成多个句子,每个主题各有一个主题?

问题描述:

有没有办法与多个科目,如分隔一个复合句:将复合句子与多个主题分成多个句子,每个主题各有一个主题?

  • 我是一个人,你是一个人。 =>我是一个人。你是一个人。
  • 狗有时吃奶酪,它是拉布拉多犬。 =>狗有时会吃奶酪。这是拉布拉多犬。

我正在考虑使用分析树和识别多个主题来分离它,但我不确定如何创建一个通常可靠地完成此操作的算法。

您需要确定结缔组织及其类型(隐性/明确的结缔组织),并用一句选区解析树识别结缔组织的论点。

例子:

(1)我是人,你是一个人。

(ROOT 
    (S 
    (S 
     (NP (PRP I)) 
     (VP (VBP am) 
     (NP (DT a) (NN human)))) 
    (CC and) 
    (S 
     (NP (PRP you)) 
     (VP (VBP are) 
     (NP (DT a) (NN human)))) 
    (. .))) 

=>在这里,你可以看到,的S - >取值CC小号。这意味着使用CC连接的两个参数都是句子本身。所以你可以直接将它们从CC中分离出来。

=>你会得到2句话。

1)我是人2)你是一个人

(2)约翰去酒店和共进午餐。

(ROOT 
    (S 
    (NP (NNP John)) 
    (VP 
     (VP (VBD went) 
     (PP (TO to) 
      (NP (NNP Hotel)))) 
     (CC and) 
     (VP (VBD had) 
     (NP (NN lunch)))) 
    (. .))) 

=>以下,VP - > VP VP CC,意味着结缔组织被用于连接两个动词组和它们具有共同的课题。因此,您可以在两个句子中使用相同的主题并添加一个VP。

=>结果将是,

1)约翰来到酒店2)约翰共进午餐

(3)约翰吃苹果和香蕉。约翰和迈克吃了苹果。

(ROOT    #John ate apple and banana. 
    (S 
    (NP (NNP John)) 
    (VP (VBD ate) 
     (NP (NN apple) 
     (CC and) 
     (NN banana))) 
    (. .))) 

(ROOT    #John and Mike ate apple. 
    (S 
    (NP (NNP John) 
     (CC and) 
     (NNP Mike)) 
    (VP (VBD ate) 
     (NP (NN apple))) 
    (. .))) 

=>以下,NP - > NN CC NNNP-> NNP CC NNP这意味着CC连接两个神经网络/既专业NNP可以单独被使用。所以你可以拆分这些NN/NNP。

=>您将在苹果2得到这样的句子,

1)约翰吃苹果2)约翰吃了香蕉[和]

1)约翰)麦克吃苹果

你必须努力工作。你可以使用POStagger和Parse树来实现这一点。

here的您如何提取使用opennlp

这很容易安装和使用,你可以按照这个blog

现在你知道如何提取使用POS句子的部分名词,形容词和动词,它一定更容易达到你想要的。

希望这有助于!