如何获取BeautifulSoup Xml解析器的数据

问题描述：

我试图用BeautifulSoup解析XML文件。在网络上的所有教程中，xml的内容给出像如何获取BeautifulSoup Xml解析器的数据

xml = "<doc><tag1>Contents 1<tag2>Contents 2<tag1>Contents 3" 
soup = BeautifulStoneSoup(xml)

但我只想给xml文件的路径。在机械化中，可以使用get_data（）方法，但它只适用于html文件。任何消化？

答

的BeautifulSoup documentation说：

“美丽汤构造取入的字符串的形式的XML或HTML文档（或开放类文件对象）它解析文档并创建一个相应的数据。记忆中的结构“。

在你的问题的提法，您使用BeautifulStoneSoup，并且allthough在线文档使用字符串，为构造函数的文档字符串表明：

“汤对象为‘根标签’初始化，提供的标记（可以是一个字符串或类似文件的对象）被提供给底层解析器。“