Hadoop生态圈

Hadoop生态圈

Linux: 操作系统
Hadoop: 解决海量数据的分布式存储分布式计算
Hbase 大数据的数据库,列式存储的数据(可存储TB,EB以上的数据)
Hive: 数据仓库
scala: 函数式编程(一种语言)
Spark: 准实时计算的一个框架
SparkSQL: 是一种交互式查询应用服务
SparkStreaming: 流式计算
Flume: 数据采集
Kafka: 消息队列
storm: 不处理静态数据,但它处理连续的流数据。
flink: 用于对*和有界数据流进行有状态计算
zookeeper: 管理,协调以上技术
Hadoop生态圈