时下最热开源大数据技术TOP10

文章讲的是时下最热开源大数据技术TOP10，眼下大数据成为最热技术，并且呈现爆炸式增长。全世界的新项目雨后春笋般的出现。对于这些新的公司、项目来说，利好就是所有可用的技术是开放源代码的,直接采用。

　　海外开发者Tim做了一个整理，小编最快速为大家呈现。（ps：不足之处，请来信指正，我的微信就在文章最下方）以下是十大热门开源的大数据技术：

　　1.Hadoop

时下最热开源大数据技术TOP10

　　特点高可用，能够为你的数据存储项目提供所需的YARN、HDFS和基础架构，并运行关键的大数据服务和应用程序。

　　2.Spark

时下最热开源大数据技术TOP10

　　易使用、支持所有重要的大数据语言(Scala、Python、Java、R)。一个巨大的生态系统，迅速的发展，对microbatching/batching/SQL支持。另外，Spark能适用于数据挖掘与机器学习等MapReduce的算法

　　3.NiFi

时下最热开源大数据技术TOP10

　　美国国家安全局(NSA)给Apache基金会的开源项目。用最简单的数据摄取、存储和处理数据。两个特性是直接的Java代码编写极其强的用户界面和数据回溯工具。好似大数据工具箱中的瑞士军刀。

　　4.Apache Hive 2.1

时下最热开源大数据技术TOP10

　　Hive 是基于Hadoop的一个数据仓库工具。可以将结构化的数据文件映射为一张数据库表，并提供完整的SQL查询功能，可以将SQL语句转换成MapReduce任务进行运行。优点就是学习成本低。最新版本的性能和功能都得到了全面提升，Hive已成为SQL在大数据上的最佳解决方案。

　　5.Kafka

时下最热开源大数据技术TOP10

　　Kafka是一种高吞吐量的分布式发布订阅消息系统，它可以处理消费者规模的网站中的所有动作流数据。这种动作(网页浏览，搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素。这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。它已成为大数据系统在异步和分布式消息之间的最佳选择。从Spark到NiFi再到第三方插件工具以至于Java到Scala，都提供了强大的粘合作用。

　　6.Phoenix

时下最热开源大数据技术TOP10