强烈推荐三本 Spark 新书籍

点击上方 "zhisheng"关注, 星标或置顶一起成长

Flink 从入门到精通 系列文章

前言

看到标题大家可能会想,zhisheng 之前不是一直写 Flink 相关的文章吗?咋开始推荐 Spark 书籍了,这里解释一下,因为本人前段时间接手了公司 Spark 引擎,所以偶尔也会抽空学习一下 Spark,这不看到几本不错的 Spark 书籍,于是想在这里与大家分享一下。

《Stream Processing with Apache Spark》

强烈推荐三本 Spark 新书籍

这本书出版时间是 2019 年 6 月,算是与 《Stream Processing with Apache Flink》是姊妹篇,主要是讲 Spark 的流处理,比如 Structured Streaming 和 Spark Streaming,对 Spark 流处理感兴趣的不可错过该书,虽然现在 Flink 是流处理的 No1,但是并不影响对比着学习他们之间的技术。

强烈推荐三本 Spark 新书籍
流处理章节目录

《Learning Spark, 2nd Edition》

强烈推荐三本 Spark 新书籍强烈推荐三本 Spark 新书籍

这本书出版时间是 2020 年 7 月,全书我觉得对于整个 Spark 的体系讲的还是很全的,从概念的介绍,到 API / SQL 的使用,再到如何优化 Spark 作业,接着讲解了 Structured Streaming,然后还讲解了通过 Spark 构建数据湖,并且该章节中还对目前很热门的三大数据湖框架 Apache Hudi / Apache Iceberg / Delta Lake 进行了介绍。接着讲解了 Spark 在机器学习相关场景的水碱和应用,最后介绍了 Spark 3.0 的新特性,也是目前唯一不多介绍 Spark 3.0 版本的书籍之一。

强烈推荐三本 Spark 新书籍
本书的目录

《Spark in Action, 2nd Edition》

强烈推荐三本 Spark 新书籍

本书出版时间是 2020 年 5 月,出版社是 Manning,不同于上面两本书是出版于 O’Reilly。本书内容跟其标题其实还是比较相符的,主讲实战,目录如下。

强烈推荐三本 Spark 新书籍

扫描下面二维码,回复 Spark 可获取本文提及到的三本书

强烈推荐三本 Spark 新书籍