用DOCTYPE解析1000000个xml文档

问题描述:

我有一百万个xml文件,我无法解析,因为它们有一个Doctype,所以我的程序有很多错误。我不知道该怎么办?用DOCTYPE解析1000000个xml文档

感谢您的帮助

我的XML文件是这样的:

<?xml version="1.0" encoding="UTF-8" standalone="no"?> 
<!DOCTYPE WEBIR SYSTEM "webir.dtd"> 
<school> 
<student id="1"> 
<firstname>ankush</firstname> 
<lastname>thakur</lastname> 
<email>beingjavaguy.gmail.com</email> 
<phone>7678767656</phone> 
</student> 
+0

你想用什么语言PROGRAMM?你有什么尝试?尝试更具体。 – 2014-11-04 10:21:22

+0

由于缺少关闭''-tag,XML似乎无效,与dtd无关。这可能是错误的原因吗? – cello 2014-11-04 10:38:36

使用目录重定向参考webir.dtd到虚拟DTD,允许任何内容。

见例如

http://www.scriptorium.com/2009/09/ignoring-doctype-in-xsl-transforms-using-saxon-9b/