Hadoop专栏(一)———分布式数据块HBase

一、HBase简介

说起Hbase,就必须说到BigTable,BigTable是当初谷歌为了处理网页设计的一种处理手段
Hadoop专栏(一)———分布式数据块HBase
网页搜索主要内容包括建立网页的索引和搜索互联网网页
Hadoop专栏(一)———分布式数据块HBase
BigTable的诞生

Hadoop专栏(一)———分布式数据块HBase
底层分布式文件系统存储完全非结构化的数据
HBase则允许几千台服务器去存储海量文件
Hadoop专栏(一)———分布式数据块HBase
Hadoop专栏(一)———分布式数据块HBase
Hadoop专栏(一)———分布式数据块HBase

HBase和BigTable的底层技术对应关系
Hadoop专栏(一)———分布式数据块HBase
主从复制
分库来实现数据块性能提升
Hadoop专栏(一)———分布式数据块HBase
为什么还要去设计HBase这么一个数据块产品呢
虽然已经有了HDFS和MapReduce,但是Hadoop主要解决大规模数据离线批处理Hadoop是没有办法满足大数据实时处理需求的随着这些年数据的大规模爆炸式增长,传统关系型数据库的扩展能力非常有限
这样操作有两个缺陷,一个是不便利,另一个是效率非常低

Hbase和传统的关系数据库有什么练习和区别?
数据类型方面:传统的关系型数据库用的是非常经典的关系型数据库模型
数据操作方面:在关系数据库当中定了非常多的数据操作
存储模式方面:关系数据库是基于行模式存储,而对于HBase来讲是基于列存储
在数据索引方面:关系数据库可以直接针对各个不同的列,构建非常复杂的索引
Hadoop专栏(一)———分布式数据块HBase

数据维护方面:在关系数据库当中做一些数据更新操作的时候,实际上里面旧的值会被新的值覆盖掉
可伸缩性方面:关系数据库是很难实现水平扩展的,最多可以实现纵向扩展
Hadoop专栏(一)———分布式数据块HBase
Hadoop专栏(一)———分布式数据块HBase

访问HBse的几种方式
Hadoop专栏(一)———分布式数据块HBase

二、Hbase数据模型

三、Hbase的实现原理

四、Hbase运行机制

五、Hbase编程实践