是否有像HtmlAgilityPack(.NET)for Python这样的好解析器?
问题描述:
我正在寻找一个像HtmlAgilityPack(开源.NET项目:http://www.codeplex.com/htmlagilitypack)的好解析器,但是适用于Python。是否有像HtmlAgilityPack(.NET)for Python这样的好解析器?
任何人都知道吗?
答
Beautiful Soup应该是你要搜索的东西。它是一个html/xml解析器,可以处理无效页面并允许遍历特定标签。
+0
lxml比BS更好地处理无效页面。使用lxml.html中的css选择器遍历标签更容易。 – aehlke 2009-08-03 20:35:53
此时BS已经成功了lxml。 – aehlke 2009-08-03 20:35:18