关于 Python3 ThreadPoolExecutor 的队列大小

【背景】

    截至 Python 3.6.6,concurrent.futures.ThreadPoolExecutor 中用的都是无·界队列,在生产速度大于消费速度时,可能会耗光系统资源,希望找到一种方式避免这种情况。


【方案一】

  • 继承 ThreadPoolExecutor,直接修改 _work_queue 为有界队列。

  • 优点:简单粗暴直接。

  • 缺点:修改了私有属性。

  • 示例:https://*.com/a/48327162


【方案二】

  • 将任务分组,每组完成后再提交下一组。

  • 优点:无需继承,不改变私有属性;能切实有效的避免资源耗费。

  • 缺点:组之间的任务是同步的,未充分利用线程,即使有剩余任务也有空闲线程存在。

  • 示例:https://*.com/a/49622149


【方案三】

  • 创建工具类委托给 ThreadPoolExecutor 实例。

  • 优点:无需继承,不改变私有属性;充分利用了线程,有剩余任务时不会有空闲线程存在。

  • 缺点:实现较为复杂。

  • 示例:https://www.bettercodebytes.com/theadpoolexecutor-with-a-bounded-queue-in-python/


【相关阅读】

  • Python3并发检验代理池地址


*** walker ***