Python数据分析_第二篇网页爬虫（1）_豆瓣页面解析

根据参数分析，我们得到BASE_URL应该是：

BASE_URL = 'https://movie.douban.com/subject/33404425/comments?start={}&limit=20&sort=new_score&status=P&percent_type={}'

我使用的是Chrome浏览器，Ctrl+U显示网页源码，可以发现豆瓣影评部分并没有使用JS动态更新，所以我们可以直接对源码进行解析。

Python数据分析_第二篇网页爬虫（1）_豆瓣页面解析

HTML<div>元素：定义文档中的分区或节（division/section）【块级元素，它是可用于组合HTML元素的容器】

HTML<span>元素：定义span，用来组合文档中的行内元素【内联元素，可用作文本的容器】

Python数据分析_第二篇 网页爬虫（1）_豆瓣页面解析