Hadoop专栏(一)———分布式数据块HBase
一、HBase简介
说起Hbase,就必须说到BigTable,BigTable是当初谷歌为了处理网页设计的一种处理手段
网页搜索主要内容包括建立网页的索引和搜索互联网网页
BigTable的诞生
底层分布式文件系统存储完全非结构化的数据
HBase则允许几千台服务器去存储海量文件
HBase和BigTable的底层技术对应关系
主从复制
分库来实现数据块性能提升
为什么还要去设计HBase这么一个数据块产品呢
虽然已经有了HDFS和MapReduce,但是Hadoop主要解决大规模数据离线批处理Hadoop是没有办法满足大数据实时处理需求的随着这些年数据的大规模爆炸式增长,传统关系型数据库的扩展能力非常有限
这样操作有两个缺陷,一个是不便利,另一个是效率非常低
Hbase和传统的关系数据库有什么练习和区别?
数据类型方面:传统的关系型数据库用的是非常经典的关系型数据库模型
数据操作方面:在关系数据库当中定了非常多的数据操作
存储模式方面:关系数据库是基于行模式存储,而对于HBase来讲是基于列存储
在数据索引方面:关系数据库可以直接针对各个不同的列,构建非常复杂的索引
数据维护方面:在关系数据库当中做一些数据更新操作的时候,实际上里面旧的值会被新的值覆盖掉
可伸缩性方面:关系数据库是很难实现水平扩展的,最多可以实现纵向扩展
访问HBse的几种方式