HIVESQL中ROW_NUMBER() OVER语法以及示例---根据某字段值相同取另一字段最大值的所有行
数据如下:
ID NAME PID CREATE_TIME
------------------------------
1 张三 A 2018-1-1
2 李四 A 2017-1-1
3 王五 B 2017-12-12
希望的查询结果(相同PID只取CREATE_TIME最大的行):
ID NAME PID CREATE_TIME
------------------------------
1 张三 A 2018-1-1
3 王五 B 2017-12-12
SQL:
select
from ( select *
,ROW_NUMBER()over(partition by PID order by CREATE_TIME desc) as disorder
from table
)T
where t.disorder=1
//-----------------------------------------------------------------------------------------ROW_NUMBER() OVER函数的基本用法
语法:ROW_NUMBER() OVER(PARTITION BY COLUMNORDER BY COLUMN)
详解:
row_number() OVER (PARTITION BY COL1 ORDERBY COL2)表示根据COL1分组,在分组内部根据COL2排序,而此函数计算的值就表示每组内部排序后的顺序编号(该编号在组内是连续并且唯一的)。
场景描述:
在Hive中employee表包括empid、depid、salary三个字段,根据部门分组,显示每个部门的工资等级。
1、原表查看:在Hive中employee表及其内容如下所示:
2、执行SQL。
SELECT *, Row_Number() OVER (partition by deptid ORDER BY salary desc) rank FROM employee
3、查看结果。
参考:https://blog.****.net/proglovercn/article/details/79549112
https://blog.****.net/wiborgite/article/details/80521593