从BeautifulSoup标签元素提取文本
问题描述:
我需要额外的发布日期,存储在<div>
。从BeautifulSoup标签元素提取文本
例如,
<div class="volltextDetails"><meta content="2016-01-27T19:03:18+01:00" itemprop="datePublished"/>OTS0258, 27. Jan. 2016, 19:03</div>
我管理与BS4找到它:
soup.find("div", {"class": "volltextDetails"})
但我真的无法弄清楚如何抓住其存储在meta content
日期(2016-01-27T19:03:18+01:00
)。
我该怎么做?
答
soup.find("div", {"class": "volltextDetails"}).meta['content']
|----------this will return div tag---------|go to meta and get content|
出来:
'2016-01-27T19:03:18+01:00'
谢谢!并为链接以及。 – Zlo