基于Spark的大数据实时处理开课

目前对大数据的实时分析工具,业界公认最佳为Spark。Spark是基于内存计算的大数据并行计算框架,Spark目前是Apache软件基金会旗下,*的开源项目,Spark提出的DAG作为MapReduce的替代方案,兼容HDFS、Hive等分布式存储层,可融入Hadoop的生态系统,以弥补缺失MapReduce的不足,事实上已成为当前互联网企业主流的大数据实时处理工具。


为解决广大系统设计人员深入研究与开发大数据实时处理的需要,培训中心在2017年6月7-9日,举办了“大数据实时处理-基于Spark的大数据实时处理及应用技术”培训班。

基于Spark的大数据实时处理开课
主讲此次课程的杨教授提供了案例分析来帮助学员了解如何用Spark实时大数据工具来解决业界的问题,并介绍了Spark生产环境搭建的相关知识。


杨教授介绍,Spark生态系统(BDAS项目)已经发展成一个,包含多个子项目的集合,包括Spark SQL、Spark Streaming、GraphX、MLlib等,本课程从大数据实时处理技术以及Spark实战的角度,结合理论和实践,全方位地介绍Spark大数据实时处理工具的原理和内核,包括Spark大数据计算框架、运行架构、设计模型和数据管理策略,及Spark在业界的应用。


希望来自各企业的学员们通过本课程学习,把Spark实时大数据处理开发上升到一个新水平。