Hive group by操作后将其他字段串接

表tmp_test

a ios

b andriod

a andriod


目标数据

a ios|andriod

b andriod


sql: select uid,concat_ws('|', collect_set(device)) from tmp_test group by uid;



collect_set 是 Hive 内置的一个聚合函数, 它返回一个消除了重复元素的对象集合, 其返回值类型是 array 。