如何从OpenNLP生成器中提取特征?

如何从OpenNLP生成器中提取特征?

问题描述:

我使用这个自定义featureGenerator:如何从OpenNLP生成器中提取特征?

AdaptiveFeatureGenerator featureGenerator = new CachedFeatureGenerator(
      new AdaptiveFeatureGenerator[]{         
       new WindowFeatureGenerator(new TokenFeatureGenerator(), 2, 2), 
       new WindowFeatureGenerator(new TokenClassFeatureGenerator(true), 2, 2), 
       new OutcomePriorFeatureGenerator(), 
       new PreviousMapFeatureGenerator(), 
       new BigramNameFeatureGenerator(), 
       new SentenceFeatureGenerator(true, false), 
       new DictionaryFeatureGenerator("person", dictionary) 
       }); 

我只加了DictionaryFeatureGenerator有几个项目:

Dictionary dictionary = new Dictionary(); 
    dictionary.put(new StringList(new String[]{"giovanni"})); 
    dictionary.put(new StringList(new String[]{"maria"})); 
    dictionary.put(new StringList(new String[]{"luca"})); 

我想看看DictionaryFeatureGenerator.java代码,但我没有发现任何东西关于该生成器的生成特征的提取。

所以问题是,在我的模型生成器列表中添加此生成器后,如何提取功能以了解什么标记匹配我的字典条目?

谢谢!

机器学习功能并不保证令牌将被标记为命名实体。这就像在标记中加入一个标记,表示该标记出现在字典中,但仍需要使用其他功能进行评估。

您可以使用DictionaryNameFinder跳过机器学习。