使用正则表达式解析版权持有者信息

使用正则表达式解析版权持有者信息

问题描述:

我正在寻找解析出版权持有人和'Inc'是否存在各种各样搞乱版权的版权注释。如果版权包含日期,我有一个正则表达式,但我正在努力想出一些可以处理这两种情况的东西。使用正则表达式解析版权持有者信息

这里有几样:

# Copyright:: 2013-2016 MyCorp, Inc. 
# Copyright:: 2013-2016 MyCorp Inc. 
# Copyright:: 2013-2016 MyCorp Inc. 
# Copyright:: 2009-2010 2013-2016 MyCorp Inc. 
# Copyright:: MyCorp Inc. 
# Copyright:: John Doe 

下面是我用的是什么含版权日期和公司如何有选择地匹配“公司”,而忽略了周围的任何建议和。如果存在。

[0-9]{4}(?!.*[0-9]{4})(.*)(?:,)? (Inc)(?:.)? 
+0

在最后一个例子,你会想匹配李四? –

我似乎是从一个简单的正则表达式不甚至使用向前看符号获得相当不错的里程:

^# Copyright::(?: (?:\d{4}-\d{4}))* (.*)$ 

这将匹配而来的可选范围一年后的一切,它应该发生。

演示在这里:

Regex101