scala、spark有关环境的一些坑


今天重新学习了下spark,出现了一系列的环境问题,总结一下,希望以后小伙伴们不要踩坑

  1. Caused by: java.lang.ClassNotFoundException: org.apache.spark:

出现这个问题的原因是pom文件配置问题,我在pom中关于spark、scala、hadoop的依赖里面使用了这个标签
scala、spark有关环境的一些坑
provided表明该包只在编译和测试的时候用,所以在启动的时候,是没有找到当前需要的环境。
解决方法:注释掉
感谢:关于maven依赖中的provided使用

  1. Exception in thread “main” java.lang.NoClassDefFoundError: org/apache/hadoop/fs/FSDataInputStream

出现这个问题的原因是没有这到这个类,这个类是Hadoop里面的,我们当前项目可能没有将hadoop环境加入进来,我们这样操作:
找到启动类,将hadoop的环境放入到里面即可。
scala、spark有关环境的一些坑

  1. java.lang.NoClassDefFoundError: scala/Product$class

这个问题就是我的scala版本是2.12.x但您使用的是scala版本2.11中编译的库。
解决:重新安装scala,将2.12的版本换成2.11就可以了
scala、spark有关环境的一些坑