如何查找以<! - ?开头的HTML注释的第一个实例(Python)
问题描述:
是否有一种简单的方法来查找以<!--
开头的HTML注释的第一个实例?如何查找以<! - ?开头的HTML注释的第一个实例(Python)
我已经做了这样:
for line in open('some.html'):
if line[:4] == "<!--":
print line
break
答
itertools.ifilter(lambda x:x.startswith('<!--'), open('test')).next()
答
使用BeautifulSoup
模块:
>>> from bs4 import BeautifulSoup, Comment
>>> html = """
... Pineapples
... <!-- I'm a sneaky comment --> Text
...
... Text <!-- Cabbages -->
... """
>>> soup = BeautifulSoup(html)
>>> print soup.find(text=lambda text:isinstance(text,Comment)).strip()
I'm a sneaky comment