Python的XML解析(使用模式来生成数据集)

问题描述:

我期待用Python解析xml文件,我想知道是否有过通过所有XML节点手动自动行走任务的任何方法/属性中使用xml.dom的.minidom库。Python的XML解析(使用模式来生成数据集)

本质上,如果我可以为我正在读取的xml文件加载xml模式,那么会自动生成某种数据结构/集合,其中包含xml中的所有数据。

在C#中的土地,这是可能通过从XML架构创建一个强类型DataSet类,然后使用该数据集读取XML文件。

有没有在Python任何等效?

+0

我用xml.parsers.expat,似乎快解析我本来认为beautifulSoup XML文件 – ladyfafa 2010-10-29 17:07:24

lxml是一个超级强大的XML解析包。它包含一个子包,lxml.objectify,它将从你的xml中创建一个对象树。

它不会从模式生成一个类 - 这可能更多的是C#/ Java的东西 - 但它确实可以进行模式验证,因此您知道回收的是什么类型的对象(请参阅“断言模式“)。

+1

lxml.objectify非常接近我的目标。谢谢! – Nick 2010-10-29 21:19:38

嘿伙计 - 以beautifulSoup - 这是一个超级图书馆。头向网站scraperwiki.com

的可以帮助你!

+0

,但我从来没有发现使得它做什么,我上面提到的方法。 – Nick 2010-10-29 17:17:00

你可以看看lxml.objectify,特别是E-工厂。它并不等同于ADO工具,但您可能会发现它很有用。