大数据学习(08)--Hadoop中的数据仓库Hive

目录

1.什么是数据仓库?

1.1数据仓库概念

大数据学习(08)--Hadoop中的数据仓库Hive

对历史数据变化的统计,从而支撑企业的决策。比如:某个商品最近一个月的销量,预判下个月应该销售多少,从而补充多少货源。

1.2传统数据仓库面临的挑战

大数据学习(08)--Hadoop中的数据仓库Hive

1.3 Hive介绍

大数据学习(08)--Hadoop中的数据仓库Hive
大数据学习(08)--Hadoop中的数据仓库Hive
大数据学习(08)--Hadoop中的数据仓库Hive

Hbase支持快速的交互式的大数据应用
pig,Hive支持批量式的数据分析业务

1.4 Hive与传统数据库的对比

大数据学习(08)--Hadoop中的数据仓库Hive

1.5 Hive在企业中的部署与应用

大数据学习(08)--Hadoop中的数据仓库Hive

2.Hive系统架构

大数据学习(08)--Hadoop中的数据仓库Hive

Microsoft推出的ODBC(Open Database Connectivity)技术 [1] 为异质数据库的访问提供了统一的接口
JDBC(Java Data Base Connectivity,java数据库连接)是一种用于执行SQL语句的Java API,可以为多种关系数据库提供统一访问,它由一组用Java语言编写的类和接口组成。
CIL (Common Intermediate Language) 公共中间语言

3.Hive工作原理

3.1 SQL转换为MapReduce作业的基本原理

大数据学习(08)--Hadoop中的数据仓库Hive
大数据学习(08)--Hadoop中的数据仓库Hive

3.2 Hive中SQL查询转换MapReduce作业的过程

大数据学习(08)--Hadoop中的数据仓库Hive
大数据学习(08)--Hadoop中的数据仓库Hive
大数据学习(08)--Hadoop中的数据仓库Hive

4.Hive HA基本原理

大数据学习(08)--Hadoop中的数据仓库Hive

5.Impala

5.1 Impala介绍

大数据学习(08)--Hadoop中的数据仓库Hive

5.2 Impala系统架构

大数据学习(08)--Hadoop中的数据仓库Hive
大数据学习(08)--Hadoop中的数据仓库Hive

5.3 Impala查询执行过程

大数据学习(08)--Hadoop中的数据仓库Hive
大数据学习(08)--Hadoop中的数据仓库Hive
大数据学习(08)--Hadoop中的数据仓库Hive

5.4 Impala和Hive的区别

大数据学习(08)--Hadoop中的数据仓库Hive
大数据学习(08)--Hadoop中的数据仓库Hive
大数据学习(08)--Hadoop中的数据仓库Hive

6.Hive编程实践

参考博客

6.1 Hive的安装和配置

大数据学习(08)--Hadoop中的数据仓库Hive

6.2 Hive的基本数据类型

大数据学习(08)--Hadoop中的数据仓库Hive
大数据学习(08)--Hadoop中的数据仓库Hive

6.3 Hive的基本操作

大数据学习(08)--Hadoop中的数据仓库Hive
大数据学习(08)--Hadoop中的数据仓库Hive
大数据学习(08)--Hadoop中的数据仓库Hive
大数据学习(08)--Hadoop中的数据仓库Hive
大数据学习(08)--Hadoop中的数据仓库Hive
大数据学习(08)--Hadoop中的数据仓库Hive

6.4 Hive的应用实例(wordCount)

大数据学习(08)--Hadoop中的数据仓库Hive大数据学习(08)--Hadoop中的数据仓库Hive

6.5 Hive的优势

大数据学习(08)--Hadoop中的数据仓库Hive

7.总结

大数据学习(08)--Hadoop中的数据仓库Hive