如何使用apache pig 处理chukwa收集的数据

如何使用apache pig 处理chukwa收集的数据，很多新手对此不是很清楚，为了帮助大家解决这个难题，下面小编将为大家详细讲解，有这方面需求的人可以来学习下，希望你能有所收获。

公司使用chukwa收集每个服务器数据的，数据收集到的hdfs以后被写成sequencefile,想用pig处理这些数据，pig本身不支持这种数据结构的，查看chukwa源码发现，本身有带有pig脚本，是hicc用来做数据统计的脚本，hicc一直不好使，也懒得搭理这玩意。

1、chukwa/script/pig/DF.pig

define chukwaLoader org.apache.hadoop.chukwa.pig.ChukwaLoader();

源码在：chukwa/contrib/chukwa-pig下边

本身chkwa支持的pig版本比较老，使用pig脚本加载这个jar包，执行压根不好使,把代码放到pig下进行编译，就可以直接使用了。

看完上述内容是否对您有帮助呢？如果还想对相关知识有进一步的了解或阅读更多相关文章，请关注行业资讯频道，感谢您对亿速云的支持。