解析HTML DIV ID包括在内的所有内容
问题描述:
我试图在专区内解析HTML文件和retreive所有内容解析HTML DIV ID包括在内的所有内容
$some_html = file_get_contents($html);
$dom = new DOMDocument();
@$dom->loadHtml($some_html);//Strict error checking off
$xpath = new DOMXPath($dom);
$result = $xpath->query('//*[@id="IDX-detailsWrapper"]');
if (!empty($result)) {
foreach ($result as $link) {var_dump($link->nodeValue); }}
的HTML:
<div id="IDX-detailsWrapper"><div id=content><h1>test</h1></div></div>
我希望能找回以下字符串
`<div id=content><h1>test</h1></div>`
,而不是
`test`
目前它只能检索div中包含的文本而不是html。
虽然我不确定这样做的确切做法!
由于JT
答
我最终使用从http://sourceforge.net/projects/simplehtmldom/files/
库和工作原理是
include('simple_html_dom.php');
$html = file_get_html($html);
foreach($html->find('div#IDX-detailsWrapper') as $e)
echo $e->innertext . '<br>';
希望这可以帮助别人:)
示例代码