Hive2.X 整合执行引擎Tez (DAG)

Hive2.X 整合执行引擎Tez (DAG)

解压压缩包:
tar -zxvf apache-tez-0.9.2-bin.tar.gz
重命名:
mv apache-tez-0.9.2-bin tez

替换tez里的两个jar包
Hive2.X 整合执行引擎Tez (DAG)
如上图,将/opt/mysoft/hadoop/share/hadoop/mapreduce 里的覆盖掉tez/lib里的对应JAR包。

配置环境变量:
vi /etc/profile
Hive2.X 整合执行引擎Tez (DAG)
将tez.tar.gz上传到HDFS上:
创建:hdfs dfs -mkdir /mytez
上传:hdfs dfs -put /opt/mysoft/tez/share/tez.tar.gz /mytez
赋权:hdfs dfs -chmod 777 /mytez

在hadoop/etc/hadoop 目录下创建tez-site.xml 文件 (只需要在qiku一台上创建就可以了)
内容如下:
Hive2.X 整合执行引擎Tez (DAG)
Hive shell中实现执行引擎: MR 和 Tez 切换

在hive-site.xml 文件中,默认的执行引擎为:hive.execution.engine = mr,可以修改也可以动态切换
临时切换成tez:set hive.execution.engine=tez;

然后执行查询任务:select name,sum(value) from jingdong groud by name;

最后在192.168.110.10:8088查看任务执行情况:

Hive2.X 整合执行引擎Tez (DAG)

Tez确实比MR快好几倍,尤其在还有迭代(对MR来说频繁读写磁盘,Tez基于DAG,尽可能的在内存完成,实在内存不够用,才会部分借助磁盘)的计算中,效率更显著。