linux 下用maven 编译spark源码版

先下载linux版本的SPARK的源码版,以及maven,然后用tar命令解压spark,maven的tgz包

添加环境变量中添加maven的路径:

使用vi /etc/profile,

然后

export M2_HOME=/usr/soft/maven3.3.9    (根据实际安装目录而定)

export PATH=$PATH:$M2_HOME/bin

然后将maven镜像源改为中国的,这里使用的是开源中国的源,使用cd命令进入maven安装目录下的conf下 ,然后

vi settings.xml

加入如下镜像:

<mirror>

    <id>nexus-osc</id>

    <mirrorOf>*</mirrorOf>

    <name>Nexus osc</name>

    <url>http://maven.oschina.net/content/groups/public/</url>

</mirror>

之后进入spark安装目录

使用命令 mvn -Dhadoop.version=2.7.2 -Phadoop-2.6 -DskipTests clean package

命令根据使用不同版本的hadoop有所改变,我用的是2.7.2版本