Spark_SQL模式和表数据存储在哪里?

问题描述:

我是Spark新手(Spark_SQL),我已经将数据加载到spark_sql中我也创建了表并将一些数据加载到它中。
我的问题是:架构和表格数据存储在哪里?Spark_SQL模式和表数据存储在哪里?

其中表架构存储

蜂房metastore

默认为Derby数据库为 “metastore”。您可以打开运行Spark作业的文件夹,您会注意到metastore_db文件夹

使用Hive时,Hive Metastore是安装Hive时建立的MySQL,Postgres,Oracle数据库。

其中表将被存储

蜂房仓库目录

HDFS /apps/hive/warehouse/<databasename>/<tablename>.db/,例如在Hortonworks环境。

默认的SparkSQL会将一个Gzipped Parquet文件保存到该目录中,作为顺序编号的part-00xyz文件,意思是“分区”。