Hive的数据模型之桶表

一 桶表(Bucket Table)
1、桶表是对数据进行哈希取值,然后放到不同文件中存储。
2、桶表利用hash运算将某一列相同哈希放入到一个桶中,从而提高查询效率。

二 理解桶表
Hive的数据模型之桶表

三 创建桶表
hive> create table bucket_table
> (sid int,sname string,age int)
> clustered by(sname) into 5 buckets;
OK
Time taken: 0.566 seconds
hive> desc bucket_table;
OK
sid int
sname string
age int
Time taken: 0.906 seconds, Fetched: 3 row(s)