SparkSQL集成Hive

(1)相关配置:

将以下文件拷贝到 $SPARK_HOME/conf 目录下

Hive: hive-site.xml

Hadoop: core-site.xml和hdfs-site.xml

同时,启动Spark shell 的时候,需要制定mysql的驱动

首先查看core-site.xml,hdfs-site.xml,hive-site.xml

SparkSQL集成Hive

 

 

 

(2)拷贝mysql-connector-java-

然后将 root/hive/lib 下面的mysql-connector-java-5.1.39.jar拷贝到某个目录下(可以自己设定目录):

如root/input 目录下:

SparkSQL集成Hive

 

 

然后首先启动hdfs.yarn集群和yarn

start-hdfs.sh

start-yarn.sh

 

接着启动spark:sbin//start-all.sh

接着在spark 下输入:

bin/spark-shell --master spark://hd09-01:7077 --jars /root/input/mysql-connector-java-5.1.39.jar

备注:hd09-01 是对应集群的主机名

输入:spark.sql("show tables").show

查看是否显示hive中的表名

 

SparkSQL集成Hive

成功显示hive的所有表