如何获取BeautifulSoup Xml解析器的数据

问题描述:

我试图用BeautifulSoup解析XML文件。在网络上的所有教程中,xml的内容给出像如何获取BeautifulSoup Xml解析器的数据

xml = "<doc><tag1>Contents 1<tag2>Contents 2<tag1>Contents 3" 
soup = BeautifulStoneSoup(xml) 

但我只想给xml文件的路径。在机械化中,可以使用get_data()方法,但它只适用于html文件。任何消化?

的BeautifulSoup documentation说:

“美丽汤构造取入的字符串的形式的XML或HTML文档(或开放类文件对象)它解析文档并创建一个相应的数据。记忆中的结构“。

在你的问题的提法,您使用BeautifulStoneSoup,并且allthough在线文档使用字符串,为构造函数的文档字符串表明:

“汤对象为‘根标签’初始化,提供的标记(可以是一个字符串或类似文件的对象)被提供给底层解析器。“