Hadoop之Hive的使用
一、环境
一*立PC机或虚拟机
每台主机内存2G以上,磁盘剩余空间500M以上
已安装CentOS 7.4操作系统
已安装JDK
已完成Hadoop平台的搭建
已完成MySQL数据库平台的搭建
已经完成Hbase的安装
已经完成Hive数据仓库的安装
二、步骤
一、启动haddop集群
二、启动Hive,查看当前的数据库列表
P练习、
三、Hive的数据模型——分区表
登录http://192.168.10.111;8080/cluster/apps查看job执行状态
(1)准备数据,在admin家目录下分别新建student1.txt内容
student2.txt
student3.txt
将文件放入HDFS文件系统
(2)创建外部表
(3)查询外部表
(4)删除HDFS上的student1.txt
(5)查询外部表
(6)将student1.txt重新放入HDFS input目录下
(7)查询外部表
五、Hive的数据模型——桶表
对数据HASH运算,房子啊不同文件中,降低热块,提高查询速度
准备文本数据
将文本数据插入到非桶数据表
六、Hive的数据模型-视图
创建一个view之前,用explain查看创建view
实际创建一个view