PHP奇怪的循环问题
对不起,长的代码,我真的失去它。PHP奇怪的循环问题
这段代码应该通过POST获得一个url列表,在每个url之间有一个breakline的textarea。该脚本应该下载每个网址,浏览html并获取一些链接,然后进入这些链接,获取一些数据并将其回显。
出于某种原因,视觉它看起来好像我正在getDetails()
只有一次,因为我只得到一个结果集。
我都检查过多次,如果foreach
循环分别需要每个URL和部分工作
任何人都可以发现这个问题?
require_once('simple_html_dom.php');
function getDetails($html) {
$dom = new simple_html_dom;
$dom->load($html);
$title = $dom->find('h1', 0)->find('a', 0);
foreach($dom->find('span[style="color:#333333"]') as $element) {
$address = $element->innertext;
}
$address = str_replace("<br>"," ",$address);
$address = str_replace(","," ",$address);
$title->innertext = str_replace(","," ",$title->innertext);
if ($address == "") {
$exp = explode("<strong><strong>",$html);
$exp2 = explode("</strong>",$exp[1]);
$address = $exp2[0];
}
echo $title->innertext . "," . $address . "<br>";
}
function getHtml($Url) {
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $Url);
curl_setopt($ch, CURLOPT_REFERER, "http://www.google.com/");
curl_setopt($ch, CURLOPT_USERAGENT, "MozillaXYZ/1.0");
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_TIMEOUT, 10);
$output = curl_exec($ch);
curl_close($ch);
return $output;
}
function getdd($u) {
$html = getHtml($u);
$dom = new simple_html_dom;
$dom->load($html);
foreach($dom->find('a') as $element) {
if (strstr($element->href,"display_one.asp")) {
$durls[] = $element->href;
}
}
return $durls;
}
if (isset($_POST['url'])) {
$urls = explode("\n",$_POST['url']);
foreach ($urls as $u) {
$durls2 = getdd($u);
$durls2 = array_unique($durls2);
foreach ($durls2 as $durl) {
$d = getHtml("http://www.example.co.il/" . $durl);
getDetails($d);
}
}
}
您只分配循环中的最后一个元素,它看起来像。你需要连接。像循环内部的$address .= $element->innertext;
(注意。=而不是=)。
编辑:除非我误认它应该做什么。我想我可能一直专注于代码的错误部分。
这部分其实没问题,我需要最后一个$ element-> innertext,所以不需要连接。问题是,它看起来像我只运行一次getDetails(),因为我只得到一组结果 –
对不起,一旦我发布,我认为我可能不正确地读它正确。但我只是尝试没有卷曲的东西,它似乎循环良好,但我不知道它会如何干扰。 –
当您在HTML DOM文档使用您$dom->loadHTMLFile()
或$dom->loadHTML()
加载它,你也应该调用libxml_use_internal_errors(true)
前手,这样就不会因为格式不正确的HTML的崩溃。
你能举一个例子,看看$ _POST ['url']可能是什么样子?我真的不明白你想做什么。 –
在那里得到一些调试输出。 echo count($ urls)。“\ n”;在外部循环处,echo“\ t”.count($ durls2)。“\ n”;在中间循环,并回显“\ t \ t”。$ durl。“\ n”;在内部循环。这将告诉你循环实际运行了多少次,然后我们可以找出它失败的位置。 – ben