正则表达式获得下一个属性的属性值
问题描述:
我试图获得属性的值,给定前面的文本。说我有这样的:正则表达式获得下一个属性的属性值
<meta content="firsttag" name="datatoget" />
我想的名字(datatoget)的value
。
我知道什么之前的具体属性(<meta ... name="
)
我怎样才能使用正则表达式,得到这个值?
我得到content="firstag" name=".*"
,它会返回我想要的,但与周围的文本。基本上我想要`。*部分。
答
(?<=name=")[a-zA-Z0-9]*
(?<=name=")
可以确保文本“名称=“”的背后是我们要匹配,而不包括它在你的结果是什么。
[a-zA-Z0-9]
限制了捕获组,以便不包括最终报价
Obligatory:[您是否尝试过使用HTML解析器?](http://*.com/a/1732454/953482)我相信很多解析库都有可爱的'getAttribute'方法,可以工作很好。 – Kevin
http://*.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454, 你是否拉动整个html页面?或者只有这1个字符串?如果你有一个完整的html文档,请看看一个html解析器,lxml,美丽的汤, – dm03514
不,我没有解析完整的文档,每次都有一些文本相同,我只需要一个简单的值,所以我想用正则表达式会更好。 – ceeee