如何查找以<! - ?开头的HTML注释的第一个实例(Python)

问题描述:

是否有一种简单的方法来查找以<!--开头的HTML注释的第一个实例?如何查找以<! - ?开头的HTML注释的第一个实例(Python)

我已经做了这样:

for line in open('some.html'): 
    if line[:4] == "<!--": 
    print line 
    break 

itertools.ifilter(lambda x:x.startswith('<!--'), open('test')).next() 

使用BeautifulSoup模块:

>>> from bs4 import BeautifulSoup, Comment 
>>> html = """ 
... Pineapples 
... <!-- I'm a sneaky comment --> Text 
... 
... Text <!-- Cabbages --> 
... """ 
>>> soup = BeautifulSoup(html) 
>>> print soup.find(text=lambda text:isinstance(text,Comment)).strip() 
I'm a sneaky comment