大数据开发之hbase的特点及应用场景详解

大数据的概念还在不断的发酵,进入这个领域的人也越来越多,大数据开发可以说是方兴未艾。而在大数据的领域内hbase的概念就成为了企业和求学者都需要关注的一个重点,那么关于hbase的特点及应用场景你们了解多少呢?

大数据开发之hbase的特点及应用场景详解

首先、我来了解hbase的概念

HBase是Apache Hadoop中的一个子项目,Hbase依托于Hadoop的HDFS作为最基本存储基础单元,通过使用hadoop的DFS工具就可以看到这些这些数据存储文件夹的结构,还可以通过Map/Reduce的框架(算法)对HBase进行操作。HBase在产品中还包含了Jetty,在HBase启动时采用嵌入式的方式来启动Jetty,因此可以通过web界面对HBase进行管理和查看当前运行的一些状态,非常轻巧。像我们平时使用的MySql可以存储的数量级为几千万条数据,Oracle数据库可以达到亿级别数据量,而HBase是分布式的,不管有多少的数据量,只要你的集群磁盘容量足够,那么它就可以存储下来。

其次、关于hbase的读写流程

读过程是根据表名和rowKey找到对应的region,zookeeper存储了meta表的region信息,从meta表中获取相应的region的信息,然后找到对应的regionserver,最后找到ui应的region。写过程与读过程基本一致。

最后、hbase的场景化应用

因为hbase的特点,造就了它不一样的特点。简单来说,你在HBase中的表创建的可以看做是一张很大的表,而这个表的属性可以根据需求去动态增加,在HBase中没有表与表之间关联查询。你只需要告诉你的数据存储到Hbase的那个column families 就可以了,不需要指定它的具体类型:char,varchar,int,tinyint,text等等。但是你需要注意HBase中不包含事务此类的功能。

Hbase的优势有很多,如今,在滴滴、淘宝、京东,乃至很多世界500强企业,都在通过hbase来推进自身的发展。

数据驱动一切的时代已经来临,各个行业对于大数据的应用也愈加的深刻,而hbase作为大数据中的一个重点内容,在未来也将受到更多商家的重视。