SparkSQL集成Hive

（1）相关配置：

将以下文件拷贝到 $SPARK_HOME/conf 目录下

Hive: hive-site.xml

Hadoop: core-site.xml和hdfs-site.xml

同时，启动Spark shell 的时候，需要制定mysql的驱动

首先查看core-site.xml，hdfs-site.xml，hive-site.xml

SparkSQL集成Hive

(2)拷贝mysql-connector-java-

然后将 root/hive/lib 下面的mysql-connector-java-5.1.39.jar拷贝到某个目录下（可以自己设定目录）：

如root/input 目录下：

SparkSQL集成Hive

然后首先启动hdfs.yarn集群和yarn

start-hdfs.sh

start-yarn.sh

接着启动spark：sbin//start-all.sh

接着在spark 下输入：

bin/spark-shell --master spark://hd09-01:7077 --jars /root/input/mysql-connector-java-5.1.39.jar

备注：hd09-01 是对应集群的主机名

输入：spark.sql("show tables").show

查看是否显示hive中的表名

SparkSQL集成Hive

成功显示hive的所有表