python爬虫_html

cs网络_HTML基本格式
python爬虫_html(图片来自中国大学mooc,图片来自中国大学mooc)
如图所示,形状如同树木。
1.大的称为“根”,小的称为“叶”
2.从根到叶成为下行遍历,反之为上行遍历,平行之间为平行遍历(这个叫法跟实际的树就不太一样了)
3.使用目录之后没有出现任何信息,可能是此时为空节点,在完整代码中需要作出判断
4.**下行遍历:**第一个返回列表类型,后两个返回迭代类型
5.上行遍历:显然可知
6.平行遍历:后两个为迭代类型,只用用在“for…in”的结构之中python爬虫_html