蟒蛇HTML标签提取
问题描述:
它是如何将有可能做到以下几点:蟒蛇HTML标签提取
- 通过HTML页面(最好是通过全域扫描(www.python.org),并提取所有
H1 H2 ... HN标签
并将所有的标题到一个文件正确的顺序:
开始与H1 比H2
,直到我们达到一个新的H1
它是如何将有可能做到以下几点:蟒蛇HTML标签提取
H1 H2 ... HN标签
并将所有的标题到一个文件正确的顺序:
开始与H1 比H2
,直到我们达到一个新的H1
这是一个严重不完整的问题。我无法做到头顶也不会尾巴。 – loevborg 2010-08-17 14:14:05