SimpleXML XML解析
我已经创建了一个脚本,它从URL获取XML并更新mysql数据库并将数据解析为csv文件。SimpleXML XML解析
我得到XML中的HTML字符串,他们不应该在那里。如何在解析时删除它们?
我加载像这样的XML文件:
$xml = simplexml_load_file(utf8_encode($xml_url), 'SimpleXMLElement', LIBXML_NOCDATA);
错误运行脚本时,我得到:
Warning: simplexml_load_file() [function.simplexml-load-file]: http://domain.com/api/get_catalog.php?id=351&user=878&key=b8:1: parser error : Space required after the Public Identifier in /dokumenti/skripte/xmlupdate/lost/test/lost_xml.php on line 59
Warning: simplexml_load_file() [function.simplexml-load-file]: <!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN"> in /dokumenti/skripte/xmlupdate/lost/test/lost_xml.php on line 59
Warning: simplexml_load_file() [function.simplexml-load-file]:^in /dokumenti/skripte/xmlupdate/lost/test/lost_xml.php on line 59
Warning: simplexml_load_file() [function.simplexml-load-file]: http://domain.com/api/get_catalog.php?id=351&user=878&key=b8:1: parser error : SystemLiteral " or ' expected in /dokumenti/skripte/xmlupdate/lost/test/lost_xml.php on line 59
Warning: simplexml_load_file() [function.simplexml-load-file]: <!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN"> in /dokumenti/skripte/xmlupdate/lost/test/lost_xml.php on line 59
Warning: simplexml_load_file() [function.simplexml-load-file]:^in /dokumenti/skripte/xmlupdate/lost/test/lost_xml.php on line 59
Warning: simplexml_load_file() [function.simplexml-load-file]: http://domain.com/api/get_catalog.php?id=351&user=878&key=b8:1: parser error : SYSTEM or PUBLIC, the URI is missing in /dokumenti/skripte/xmlupdate/lost/test/lost_xml.php on line 59
Warning: simplexml_load_file() [function.simplexml-load-file]: <!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN"> in /dokumenti/skripte/xmlupdate/lost/test/lost_xml.php on line 59
Warning: simplexml_load_file() [function.simplexml-load-file]:^in /dokumenti/skripte/xmlupdate/lost/test/lost_xml.php on line 59
xml $ not loaded.
当我使用Firefox和从URL保存XML到磁盘我没有问题解析它只是当我试图从URL中获取它。
XML看起来不错:XML的 部分:
<?xml version="1.0" encoding="UTF-8"?>
<RecroKatalog>
<viewCustomerDiscount>
<BrojArtikla>10214</BrojArtikla>
<Naziv>Eksterno kucište 2.5" S-ATA+IDE HDD, Aluminium, USB 2.0</Naziv>
<NetoPrice>81.8224</NetoPrice>
<Status>Dostupno</Status>
<Opis></Opis>
<dugi_opis>Isporucuje se u SIVOJ boji</dugi_opis>
<Image>http://shop.lost.hr/data/images/big/10.jpg</Image>
<WEB_Grupa>Ladice i eksterna kucišta - OSTALO</WEB_Grupa>
<Akcija>0</Akcija>
<Proizvodjac></Proizvodjac>
<Klasifikacija>PH-25SD-B/VK220</Klasifikacija>
</viewCustomerDiscount>
有一些巨大线索中的错误消息。它抱怨看到:
<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
它是由该网站提供的HTML文档的开始...而不是你正在寻找的XML。
这通常发生在您必须针对远程服务进行身份验证时(因此您在登录时在浏览器中工作),但是您不告诉SimpleXML为您执行此操作。
我认为这与他的陈述有关:*“今天停止工作,我很困惑,因为它读取的不是XML”*。但这并不能真正帮助我们。 –
但是,当我使用浏览器访问该网址时,我获得了有效的XML? 3小时前这工作?如何在20天内工作? – mehnihma
@mehnihma什么网址?...... –
因为它不是有效的xml。 –
看起来像附加行附加到您的XML当您远程调用它,并导致它无效 – Wilq
首先,您可以使用XMLReader :: isValid(void)来查看您的xml文档是否有效。 – user1929959