负前瞻解析HTML
问题描述:
我有这样一个规律:负前瞻解析HTML
/<img([^>]*?)(?!\sdata-src=([\'\"])[\S\h\v]*?\2)\ssrc=([\'\"])([\S\h\v]*?)\3/igm
这就是我想达到的目标:
<img src="test'"/> # this should be matched, and it is
<img data-src="abc" src="abc"/> # this one shouldn't be matched, but it is
我不明白为什么我负前瞻不工作 - 正如你所看到的,我不希望data-src
参数出现在参数src
之前。
为了测试我的表达式,我使用了regex101,我的例子是基于它的。我将在PHP中使用该正则表达式。
为了满足PHP社区:
$html = '<img src="test\'"/><img data-src="abc" src="abc"/>';
$html = preg_replace('/<img([^>]*?)(?!\sdata-src=([\'\"])[\S\h\v]*?\2)\ssrc=([\'\"])([\S\h\v]*?)\3/i', '<img$1 data-src=$3$4$3 src=$3placeholder$3', $html);
echo $html;
>>> <img data-src="test'" src="placeholder"/><img data-src="abc" src="abc"/>
答
+0
但是在src之前会有其他参数(甚至是非正确的)时它将不起作用,这就是为什么我已经放置了'([^>] ??' – Roomy
+1
我更新了我的答案...并简化了你的正则表达式。 – Fallenhero
请出示实际投入与预期输出一起。而正则表达式不是解析HTML的正确工具 –
@NarendrasinghSisodia如果你想让我使用DOMDocument或其他东西,我会简单地说 - 不。我不能依赖libxml。 – Roomy