【大数据实验】02. 安装HBase2.2.2
【大数据实验】02. 安装HBase2.2.2
完成时间:2020-0907
参考资料:
1.厦门大学数据库实验室 http://dblab.xmu.edu.cn/blog/2630-2/
2.厦门大学慕课《大数据技术原理与应用》http://www.icourse163.org/course/XMU-1002335004#/info
主机的开发环境: 华为 MagicBook,Windows10。
虚拟软件: VirtualBox 6.1.12
虚拟机的操作系统: Ubuntu 20.04.1 LTS
一、下载HBase
HBase是一个分布式的、面向列的开源数据库,源于Google的一篇论文《BigTable:一个结构化数据的分布式存储系统》。HBase以表的形式存储数据,表有行和列组成,列划分为若干个列族/列簇(column family)。欲了解HBase的官方资讯,请访问HBase官方网站。
HBase的运行有三种模式:单机模式、伪分布式模式、分布式模式。
单机模式:在一台计算机上安装和使用HBase,不涉及数据的分布式存储;伪分布式模式:在一台计算机上模拟一个小的集群;分布式模式:使用多台计算机实现物理意义上的分布式存储。这里出于学习目的,我们只重点讨论单机模式和伪分布式模式。
林子雨老师的教程运行环境是在64位Ubuntu系统,HBase版本为hbase-2.2.2,这是目前已经发行的已经编译好的稳定的版本,带有src的文件是未编译的版本,这里我们只要下载bin版本hbase-2.2.2-bin.tar.gz就好了。
从HBase官方网址:http://archive.apache.org/dist/hbase/ 下载 2.2.2版本的HBase,
得到 hbase-2.2.2-bin.tar.gz 文件,存放于 ~/Downloads 目录下。
二、安装HBase
在安装HBase之前,首先确保电脑中已经安装了Hadoop3.1.3,由于HBase对Hadoop具有版本依赖性,所以,在安装HBase2.2.2时,一定要首先安装Hadoop3.1.3。
-
解压安装包hbase-2.2.2-bin.tar.gz到路径 /usr/local,命令如下:
cd ~
sudo tar -zxf ~/Downloads/hbase-2.2.2-bin.tar.gz -C /usr/local
-
将解压的文件名 hbase-2.2.2 改为hbase,以方便使用,命令如下:
cd /usr/local
sudo mv ./hbase-2.2.2 ./hbase
-
配置环境变量
将 hbase 下的bin目录添加到 path 中,这样,启动hbase就无需到/usr/local/hbase目录下,大大的方便了hbase的使用。
在终端执行:code ~/.bashrc
,
编辑 ~/.bashrc文件,在 ~/.bashrc文件尾行添加如下内容:export PATH=$PATH:/usr/local/hbase/bin
编辑完成后,再执行source命令使上述配置在当前终端立即生效,命令如下:source ~/.bashrc
-
把 hbase 目录权限赋予给 dsj 用户,命令如下:
cd /usr/local
sudo chown -R dsj ./hbase
执行此命令将hbase下的所有文件的所有者改为dsj,dsj是当前用户的用户名。 -
查看HBase版本,确定hbase安装成功,命令如下:
/usr/local/hbase/bin/hbase version
看到输出版本消息表示HBase已经安装成功,接下来将分别进行HBase单机模式和伪分布式模式的配置。
三、配置HBase
HBase有三种运行模式,单机模式、伪分布式模式、分布式模式。作为学习,我们重点讨论单机模式和伪分布式模式。
以下先决条件很重要,比如没有配置JAVA_HOME环境变量,就会报错。
– jdk
– Hadoop(> 单机模式不需要,伪分布式模式和分布式模式需要)
– SSH
以上三者如果没有安装,请回到Hadoop3.1.3的安装参考如何安装。
(一)单机模式配置
-
编辑 /usr/local/hbase/conf/hbase-env.sh 文件。
在终端执行:code /usr/local/hbase/conf/hbase-env.sh
配置JAVA环境变量,并添加配置HBASE_MANAGES_ZK为true。
前面已经安装了JDK1.8,JDK的安装目录是/usr/lib/jvm/jdk1.8.0_162, 则JAVA _HOME =/usr/lib/jvm/jdk1.8.0_162;
配置HBASE_MANAGES_ZK为true,表示由hbase自己管理zookeeper,不需要单独的zookeeper。
hbase-env.sh中本来就存在这些变量的配置,我们只需要删除前面的#,并修改配置内容即可(#代表注释)。 -
编辑/usr/local/hbase/conf/hbase-site.xml文件
在终端中执行:code /usr/local/hbase/conf/hbase-site.xml
在启动HBase前需要设置属性hbase.rootdir,用于指定HBase数据的存储位置,因为如果不设置的话,hbase.rootdir默认为/tmp/hbase-${user.name},这意味着每次重启系统都会丢失数据。此处设置为HBase安装目录下的hbase-tmp文件夹即(/usr/local/hbase/hbase-tmp),添加配置如下:<configuration>
<property>
<name>hbase.rootdir</name>
<value>file:///usr/local/hbase/hbase-tmp</value>
</property>
</configuration>
-
接下来测试运行。首先切换目录至HBase安装目录/usr/local/hbase;再启动HBase。命令如下:
cd /usr/local/hbase
bin/start-hbase.sh
bin/hbase shell
上述三条命令中,sudo bin/start-hbase.sh
用于启动HBase,bin/hbase shell
用于打开shell命令行模式,用户可以通过输入shell命令操作HBase数据库。
停止HBase运行,命令如下:bin/stop-hbase.sh
成功启动HBase的界面如下图: -
Enjoy!!!!