简单的python爬取淘宝数据

进入淘宝网页https://www.taobao.com/
查找’衣服’ https://s.taobao.com/search?q=%E8%A1%A3%E6%9C%8D&imgfile=&commend=all&ssid=s5-e&search_type=item&sourceId=tb.index&spm=a21bo.2017.201856-taobao-item.1&ie=utf8&initiative_id=tbindexz_20170306

衣服—%E8%A1%A3%E6%9C%8D
q=%E8%A1%A3%E6%9C%8D
q=宝贝名称–>不能是中文
import urllib.request as r
r.quote(‘衣服’)
2.返回的数据就是json
&ajax=true
3.网络请求获取淘宝信息
h=input(‘输入你想要的商品’)
import urllib.request as r

url=‘https://s.taobao.com/search?q={}&js=1&stats_click=search_radio_all%3A1&initiative_id=staobaoz_20190401&ie=utf8&ajax=true

headers={‘User-Agent’:‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36’}
####将url地址和headers封装成一个Request对象,然后交给urllib
request=r.Request(url.format(r.quote(h)),headers=headers)
rst=r.urlopen(request).read().decode(‘utf-8’)

首先 先写出实体类 在淘宝页面上 先找到自己需要的数据
如:商品名称,商品价格,商铺名称,发货地点,付款人数,评价人数
然后 把获取到的json数据 转化为我们需要的 字典模式
import json
kxo=json.loads(rst)
简单的python爬取淘宝数据
最后 取到自己需要的数据
简单的python爬取淘宝数据
PrettyTable 是第三方美化包 只为美化最后效果
x.sortby=‘商品价格’ 是按照商品价格从小到大的顺序排列 因为获取的数据为str类型,不可进行排列 所以要转换成float类型 进行排列

最后展示
简单的python爬取淘宝数据