京东和亚马逊商品页面的爬取

京东商品页面的爬取

爬取的网页如下

京东和亚马逊商品页面的爬取


爬取网页的相关代码及结果如下

京东和亚马逊商品页面的爬取

全代码

京东和亚马逊商品页面的爬取


亚马逊商品页面的爬取

爬取如下的页面

京东和亚马逊商品页面的爬取

输入上面京东页面的程序,代码及结果如下

京东和亚马逊商品页面的爬取

r.status_code不是200,说明有错,再将r.apparent_encoding取代r.encoding,用来显示内容。可以看到有红色一句,说明服务器对爬虫有检测

下面用headers检查头,显示如下

京东和亚马逊商品页面的爬取

可以看到爬虫如实的告诉服务器自己是一个网络爬虫,因此可以修改头,以模拟浏览器访问服务器,修改方法以及效果如下

京东和亚马逊商品页面的爬取

成功~

全代码

京东和亚马逊商品页面的爬取