hive去重统计

hive去重多行数据并统计

hive去重统计

这个是练习数据部分截图,可以看出有部分重复数据

OK我们先进入hive

然后创建库uid

create database uid;

然后创建表uid_id

create table uid_id(uid_id int);

然后去重

select distinct uid_id from uid;

最后完成会弹一个提示里面有表的数据量就是出重后剩余的数量