转载知乎——如何编写一个获取百度Place API里面POI数据的爬虫

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

百度POI代码修正

定量城市规划研究Series01 · Part I:用Python采集百度POI数据

更新,推荐以上微信公众号中的实现代码,亲测可以实现。它是把地图按矩形区域划分,按矩形区域获取。应该可以突破400限制。

感谢原作者,膜拜!

还有,推荐去GitHub搜相关资源

我这个方法太渣了。。。。

以下原答案

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

正好自己总结一下,以后用着方便。

1.首先在百度地图开发者平台申请开发者密匙,申请结果如图;

转载知乎——如何编写一个获取百度Place API里面POI数据的爬虫

2.在百度地图开发平台中找到开发-web服务API,如图;

转载知乎——如何编写一个获取百度Place API里面POI数据的爬虫

3.在web服务API中找到Place API,并进入其页面,如图;

转载知乎——如何编写一个获取百度Place API里面POI数据的爬虫

4.查阅页面中place检索示例,如图;

转载知乎——如何编写一个获取百度Place API里面POI数据的爬虫

5.银行、北京、{您的密匙}可以根据自己需要替换,替换后打开链接地址,我以殡葬服务、北京市为例,链接地址为:

转载知乎——如何编写一个获取百度Place API里面POI数据的爬虫

其中,page_size=10和page_num=0都可以替换,具体含义在place API页面有介绍;

这个链接地址粘贴在页面上结果为

http://api.map.baidu.com/place/v2/search?query=%E6%AE%A1%E8%91%AC%E6%9C%8D%E5%8A%A1&page_size=1&page_num=0&scope=1&region=%E5%8C%97%E4%BA%AC&output=json&ak=Tyt2xMuBxAeuLKqfEijPo039

搜索结果为:

转载知乎——如何编写一个获取百度Place API里面POI数据的爬虫

6.用Python爬虫程序抓取

我编写的程序如下:

转载知乎——如何编写一个获取百度Place API里面POI数据的爬虫

这个程序就可以把除开page_num=0的另外251个地点的poi相关信息提取出来,并保持在txt文档中;自己在加上第0条结果;

7.txt结果文档如下局部示例:

转载知乎——如何编写一个获取百度Place API里面POI数据的爬虫

8.用“万能坐标转换器”进行转换,然后Arcgis软件上进行分析啦。

但是百度POI的提取有限制哦。批量转换后部分结果示例:

转载知乎——如何编写一个获取百度Place API里面POI数据的爬虫9.txt转为excel格式导入arcgis可视化