分布式数据库HBase---大数据原理和技术---学习笔记三
一 BIg Table
1.爬虫抓取页面,每页一行地存入BIgTable
2.MapReduce在表上生成索引,为搜索做准备
二HBase
面向行的存储优势:
是利于事务型操作,不利于分析某单列数据
面向列的存储优势:
分析数据,大有优势,有很高的数据压缩率
HBase的功能组件:
–(1)库函数:链接到每个客户端
–(2)一个Master主服务器,负责负载均衡等
–(3)多个Region服务器
如何知道一个Region到底存储到哪里去了呢?
zookeeper管理整个Hbase集群
最关心的是: