AI 开源项目 - Dask
# AI 开源项目 - Dask #
当开发者需要并行化到多核时,可以用 Dask 来将计算扩展到多个内核甚至多个机器。
Dask 提供了 NumPy Arrays,Pandas Dataframes 和常规列表的抽象,能够在无法放入主内存的数据集上并行运行。对大型数据集来说,Dask 的高级集合是 NumPy 和 Pandas 的替代方案。
GitHub 地址:
https://github.com/dask/dask
https://www.toutiao.com/a1661017743626243