获取标签的美丽汤

问题描述：

<a href="/watch?gl=US&amp;client=mv-google&amp;hl=en&amp;v=0C_yXOhJxWg">Miss Black OCU 2011</a>

我的程序读取一个HTML文件，上面是该文件的块。我如何在Python中使用BeautifulSoup提取“Miss Black OCU 2011”。

不要使用挥发性的服务，如引擎收录！ – 2011-03-04 04:56:34

什么是您的搜索的特定标准？ – 2011-03-04 04:58:00

您需要将代码从pastebin移动到您的问题。你的问题将存在多年，但在30天内它将缺乏所有背景。 – 2011-03-04 05:33:37

答

这里有一个快速的解决办法：

>>> from BeautifulSoup import BeautifulSoup as BS 
>>> soup = BS('<a href="/watch?gl=US&amp;client=mv-google&amp;hl=en&amp;v=0C_yXOhJxWg">Miss Black OCU 2011</a>') 
>>> tags = soup.findAll('a', href=True) 
>>> for tag in tags: tag.renderContents() 
'Miss Black OCU 2011' 
>>>

获取标签的美丽汤

相关推荐