Spark_SQL模式和表数据存储在哪里?
问题描述:
我是Spark新手(Spark_SQL),我已经将数据加载到spark_sql中我也创建了表并将一些数据加载到它中。
我的问题是:架构和表格数据存储在哪里?Spark_SQL模式和表数据存储在哪里?
答
其中表架构存储
蜂房metastore
默认为Derby数据库为 “metastore”。您可以打开运行Spark作业的文件夹,您会注意到metastore_db
文件夹
使用Hive时,Hive Metastore是安装Hive时建立的MySQL,Postgres,Oracle数据库。
其中表将被存储
蜂房仓库目录
HDFS /apps/hive/warehouse/<databasename>/<tablename>.db/
,例如在Hortonworks环境。
默认的SparkSQL会将一个Gzipped Parquet文件保存到该目录中,作为顺序编号的part-00xyz
文件,意思是“分区”。