HBase Shell 基本使用

本文链接:https://blog.csdn.net/u010416101/article/details/89186320


HBase Shell 基本使用HBase Shell 基本使用
HBase Shell 基本使用
在HBase内, 数据按照<行键><列族1: 列1-1, 列1-2><列族2: 列2-1, 列2-2>这样的类型进行存储的. 且, 其一, 其中行键的排列顺序是按照字典顺序排序的, 这点对于搜索非常重要. 其二, 同一行键的相同列族中列的值, 是可能变化的, 并且按照时间戳进行排序的.(当然, 有些数据在合并的时候, 会被删除.)
其中, 相应的模块知识, 如下所示:

  1. Row Key
    Row Key, 行键. 是用来检索记录的主键. 访问HBase Table中的行, 主要有三种方式. 单个row key进行访问/通过 row key 正则匹配 / 全表扫描. Row Key的值可以是任意字符串(最大长度为64KB, 实际使用经常为10-100byte) .其中, 行键的排列顺序是按照字典顺序排序的, 这点对于搜索非常重要. (PS: 字典顺序: 1 10 12 6 7 9 中, 11排在9之前.)

  2. Columns Family
    Columns Family列族. HBase内的每个列, 都属于一个列族. 列族是Schema一部分(即,表设计), 而列不是(列可以在插入数据时, 动态添加). 列族是需要在使用之前进行提前定义的. 列名都以列族为前缀, 如course:namecourse:age.

  3. Cell
    Cell, 数据单元. 有<row key, Columns Family, Column ,version>唯一确定的单元. Cell内的数据是没有类型的, 全部都是字节码进行存储的.
    Time Stamp
    每个Cell存储一个数据的多个版本. 版本号, 通过时间戳进行索引(时间精确到毫秒). 时间戳类型为64位整数类型. 时间戳按照时间类型倒叙排序.
    回收版本机制: <保存数据的最后n个版本>/<保存最近一段时间的版本(如最近七天)>.

HBase Shell 基本使用
HBase Shell 基本使用
HBase Shell 基本使用
HBase Shell 基本使用
HBase Shell 基本使用

HBase Shell 基本使用
HBase Shell 基本使用

HBase Shell 基本使用

HBase Shell 基本使用