Python爬虫入门之使用Redis+Flask维护动态代理池

代理池的要求

  • 多站抓取, 异步检测
  • 定时筛选, 持续更新
  • 提供接口, 易于提取

代理池架构

Python爬虫入门之使用Redis+Flask维护动态代理池

代码

代码放到github上了,稍微修改了一点,可以正常运行了.有问题评论留言讨论.

分为两种ProxyPoolPopProxyPoolPro. 第一种是用完ip就扔掉,第二种反复利用.地址如下:

ProxyPoolPop

ProxyPoolPro