2.8之前识别软件和版本范围在一个句子

问题描述:

我有类似以下格式<code>2.8</code>之前识别软件和版本范围在一个句子

这个漏洞发生在Firefox1.x1.8之前的句子,Safari 2.x

鉴于上面的句子,我想提取字典

{Firefox: 1.0-1.8, Safari: 2.0-2.8} 

问题是我应该如何确定版本范围内来使用NLP技术,他们所属的软件?

我会用净入学率,一个用于检测的名字和一个版本的组合:

enter image description here enter image description here

您可能需要: - 请情况下NER流行软件的列表错过了它。
- Hacky修复软件版本号的方法;如“1.x”未正确检测到。

你可以在这里玩:http://nlp.cogcomp.org

+0

谢谢!想知道如何在检测后将版本与软件进行匹配? – william007

+0

我想说只是添加一些规则来解决这个问题。目前没有软件可以检测到这些数字... – Daniel