BeautifulSoup解析嵌套div标签
问题描述:
我需要从以下结构BeautifulSoup解析嵌套div标签
<div>
A
**<div>**
B
<div>
C
</div>
</div>
</div>
<div>
A
**<div>**
B
<div>
C
</div>
</div>
</div>
我曾经选择做这个选择第二个div:
divs = soup.select("div > div")
但随着第二个div一起和它的内容,它也选择第三个div作为列表的一部分。如何在我的退货清单中只选择标有的div。
答
在Python中,你可以使用以下行:
# select all the div tags in page
divs = soup.find_all('div')
for item in divs:
inner_div = item.div
首先,你选择所有div标签,然后你自主选择每一个。如果您想翻译成其他语言,请访问该语言的美丽汤页。