javascript正则表达式匹配任何不属于特定属性的内容

问题描述:

可以说我想匹配url,它不在html标签中的特定属性集内。javascript正则表达式匹配任何不属于特定属性的内容

<span cstm1="url1" cstm2="url2" data-x="url3">url4</span> 

我想匹配URL3只有URL4,所以我想是这样的:

/(?!(?:cstm1|cstm2)=["']?)(url_regex)/g 

问题是负先行断言需要在前面的东西,我不能保证数不能里面的引号是因为它仍然有效,所以我没有任何合理的东西来支持这个负面的前瞻断言。

如果我能够使用负面看后面断言它会很容易,但我使用JavaScript不支持它,所以我有点卡住,并寻求如何实现这一目标的帮助。

我寻找正则表达式唯一的解决方案。

编辑:

的URL正则表达式我用来寻找网址:

((?:(?:https?):\/\/)(?:\S+(?::\S*)[email protected])?(?:(?!10(?:\.\d{1,3}){3})(?!127(?:\.\d{1,3}){3})(?!169\.254(?:\.\d{1,3}){2})(?!192\.168(?:\.\d{1,3}){2})(?!172\.(?:1[6-9]|2\d|3[0-1])(?:\.\d{1,3}){2})(?:[1-9]\d?|1\d\d|2[01]\d|22[0-3])(?:\.(?:1?\d{1,2}|2[0-4]\d|25[0-5])){2}(?:\.(?:[1-9]\d?|1\d\d|2[0-4]\d|25[0-4]))|\[(?:(?:[0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|(?:[0-9a-fA-F]{1,4}:){1,7}:|(?:[0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]{1,4}|(?:[0-9a-fA-F]{1,4}:){1,5}(?::[0-9a-fA-F]{1,4}){1,2}|(?:[0-9a-fA-F]{1,4}:){1,4}(?::[0-9a-fA-F]{1,4}){1,3}|(?:[0-9a-fA-F]{1,4}:){1,3}(?::[0-9a-fA-F]{1,4}){1,4}|(?:[0-9a-fA-F]{1,4}:){1,2}(?::[0-9a-fA-F]{1,4}){1,5}|[0-9a-fA-F]{1,4}:(?:(?::[0-9a-fA-F]{1,4}){1,6})|:(?:(?::[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(?::[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|::(?:ffff(?::0{1,4}){0,1}:){0,1}(?:(?:25[0-5]|(?:2[0-4]|1{0,1}[0-9]){0,1}[0-9]).){3,3}(?:25[0-5]|(?:2[0-4]|1{0,1}[0-9]){0,1}[0-9])|(?:[0-9a-fA-F]{1,4}:){1,4}:(?:(?:25[0-5]|(?:2[0-4]|1{0,1}[0-9]){0,1}[0-9]).){3,3}(?:25[0-5]|(?:2[0-4]|1{0,1}[0-9]){0,1}[0-9]))\]|localhost|(?:xn--[a-z0-9\-]{1,59}|(?:(?:[a-z\u00a1-\uffff0-9]+-?){0,62}[a-z\u00a1-\uffff0-9]{1,63}))(?:\.(?:xn--[a-z0-9\-]{1,59}|(?:[a-z\u00a1-\uffff0-9]+-?){0,62}[a-z\u00a1-\uffff0-9]{1,63}))*(?:\.(?:xn--[a-z0-9\-]{1,59}|(?:[a-z\u00a1-\uffff]{2,63}))))(?::\d{2,5})?(?:\/[^"'()<>\s]*)?) 

在没有可以使用回顾后捕获组来提取您的结果。

/(?:cstm1|cstm2)=(['"]?)\d+\1|(\b\d+\b)/ig 

使用captured group #2作为您的匹配项。

RegEx Demo

+0

谢谢,但我有一个问题。当我说我想要捕捉数字时,我有点撒谎,我希望捕捉网址。我有一个从gist.github.com/dperini/729294取得的正则表达式的网址,做了一些修改。我试图用正则表达式替换正则表达式的\ d +部分,但不幸的是它找到了一切。我无法弄清楚为什么会在插入url正则表达式时发生这种情况,我已将修改后的url正则表达式添加到OP中。 – Jorayen

+0

您将需要编辑该问题以澄清更多。解析网址与您的原始问题完全不同。我建议您添加样本输入网址和您的预期输出。 – anubhava