hive的体系架构

大数据分析引擎:Hive(蜂巢),支持SQL(表:数据模型)

1、什么是Hive?
        (*)Hive是基于HDFS之上的一个数据仓库
                Hive        HDFS
                表             目录
                数据        文件
                分区        目录
                桶            文件
        (*)Hive是一个翻译器,默认,把SQL ----> MapReduce
        (*)Hive支持SQL的一个子集。

2、hive的体系结构

hive的体系架构

hive是通过sql最后翻译成mapreduce程序来执行数据分析的

我们也可以创建hive on spark