分布式数据库HBase---大数据原理和技术---学习笔记三

一 BIg Table
1.爬虫抓取页面,每页一行地存入BIgTable
2.MapReduce在表上生成索引,为搜索做准备

二HBase

分布式数据库HBase---大数据原理和技术---学习笔记三
分布式数据库HBase---大数据原理和技术---学习笔记三
分布式数据库HBase---大数据原理和技术---学习笔记三
分布式数据库HBase---大数据原理和技术---学习笔记三
分布式数据库HBase---大数据原理和技术---学习笔记三
分布式数据库HBase---大数据原理和技术---学习笔记三
分布式数据库HBase---大数据原理和技术---学习笔记三
分布式数据库HBase---大数据原理和技术---学习笔记三
分布式数据库HBase---大数据原理和技术---学习笔记三
分布式数据库HBase---大数据原理和技术---学习笔记三
面向行的存储优势:
是利于事务型操作,不利于分析某单列数据

面向列的存储优势:
分析数据,大有优势,有很高的数据压缩率

HBase的功能组件:
–(1)库函数:链接到每个客户端
–(2)一个Master主服务器,负责负载均衡等
–(3)多个Region服务器

如何知道一个Region到底存储到哪里去了呢?
分布式数据库HBase---大数据原理和技术---学习笔记三
分布式数据库HBase---大数据原理和技术---学习笔记三
分布式数据库HBase---大数据原理和技术---学习笔记三

分布式数据库HBase---大数据原理和技术---学习笔记三
zookeeper管理整个Hbase集群
分布式数据库HBase---大数据原理和技术---学习笔记三
分布式数据库HBase---大数据原理和技术---学习笔记三
分布式数据库HBase---大数据原理和技术---学习笔记三
分布式数据库HBase---大数据原理和技术---学习笔记三
分布式数据库HBase---大数据原理和技术---学习笔记三

最关心的是:
分布式数据库HBase---大数据原理和技术---学习笔记三
分布式数据库HBase---大数据原理和技术---学习笔记三