windows7下安装pyspark步骤及可能遇到的问题。

本文安装的各软件版本：jdk：1.8；spark：2.3.1；Hadoop：2.7.3

具体安装步骤

jdk官网链接
或者下载链接jdk1.8
运行spark时，需要的JDK的安装目录不能带空格，要不然会报错。之前我的jdk安装目录是D:\Program Files\java**,运行spark运行报错“spark 不是内部命令”。

电脑第一次安装JDK，点击安装文件，选择需要安装的目录，点击下一步即可。
配置环境变量：
(1) 点击计算机-属性-高级系统设置-环境变量。在系统变量下新建，变量名JAVA_HOME，变量值，jdk路径（我的是D:\InstallFiles\JDK），保存。
(2) 新建，变量名CLASSPATH，变量值， .;%JAVA_HOME%\lib;%JAVA_HOME%\lib\tools.jar。
(3) 打开Path变量，在变量值最前加入 %JAVA_HOME%\bin;%JAVA_HOME%\jre\bin;
(4) 执行cmd,输入javac 、java -version 查看是否安装成功。
如果电脑需要卸载JDK重新安装。先进入控制面板，卸载JDK，然后打开环境变量path查看是否存在类似C:\Program Files (x86)\Common Files\Oracle\Java\javapath这句，目前不清楚这个目录是干嘛的，进入这个目录，删除java相关的三个.exe 文件（不删除，重新安装JDK后，JDK还是之前的目录）。然后重新安装，重新安装后，执行java-verbose，查看命令最后一行，是否是新安装的目录。

anaconda下载官网

hadoop下载官网
或者下载免安装
windows下安装hadoop还需要一个插件下载

spark下载官网
或者下载免安装

windows7下安装pyspark步骤及可能遇到的问题。