正则表达式获得下一个属性的属性值

问题描述:

我试图获得属性的值,给定前面的文本。说我有这样的:正则表达式获得下一个属性的属性值

<meta content="firsttag" name="datatoget" /> 

我想的名字(datatoget)的value
我知道什么之前的具体属性(<meta ... name="

我怎样才能使用正则表达式,得到这个值?

我得到content="firstag" name=".*",它会返回我想要的,但与周围的文本。基本上我想要`。*部分。

+1

Obligatory:[您是否尝试过使用HTML解析器?](http://*.com/a/1732454/953482)我相信很多解析库都有可爱的'getAttribute'方法,可以工作很好。 – Kevin

+0

http://*.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454, 你是否拉动整个html页面?或者只有这1个字符串?如果你有一个完整的html文档,请看看一个html解析器,lxml,美丽的汤, – dm03514

+0

不,我没有解析完整的文档,每次都有一些文本相同,我只需要一个简单的值,所以我想用正则表达式会更好。 – ceeee

(?<=name=")[a-zA-Z0-9]* 

(?<=name=")可以确保文本“名称=“”的背后是我们要匹配,而不包括它在你的结果是什么。

[a-zA-Z0-9]限制了捕获组,以便不包括最终报价