5分钟图解《Spark快速大数据分析》步骤5:Spark第一个简单案例
第0步:先欣赏下图红框内容,下面三行代码,就是一个完整的简单案例。
第1步:通过读取文件“README.md”,创建一个名为lines的RDD。这个源文件就位于spark的根目录下,可以在E盘spark安装文件夹里找到。
第2步:使用count()方法,统计RDD中元素的个数,结果显示有103个元素。
第3步:使用first()方法,统计RDD中的第一个元素,其实就是“README.md”的第一行,可以用记事本打开看看,检查一下第一行是不是“#Apache Spark”