Hive数据类型

一、 基本数据类型 

Hive数据类型

Hive数据类型

对于 Hive 的 String 类型相当于数据库的 varchar 类型,该类型是一个可变的字符串,不过它不能声明其中最多能存储多少个字符,理论上它可以存储 2GB 的字符数。 

二、集合数据类型 

Hive 有三种复杂数据类型 ARRAY、MAP 和 STRUCT。ARRAY 和 MAP 与 Java 中的Array 和 Map 类似,而 STRUCT 与 C 语言中的 Struct 类似,它封装了一个命名字段集合,复杂数据类型允许任意层次的嵌套。 

Hive数据类型

三、实战

{
  "name":"neo",
  "friends":["zs","lisi"],
  "children":{
    "xiao neo":18,
    "xiaoxiao neo":10
  },
  "address":{
    "street":"yuanqu",
    "city":"suzhu"
  }
}

如果数据源是上述的一个json,hive是无法解析的,需要做预处理成

neo,zs_lisi,xiao neo:18_xiaoxiao neo:10,yuanqu_suzhu

创建表

create table personInfo(
 name string, 
 friends array<string>, 
 children map<string, int>, 
 address struct<street:string, city:string> 
 ) 
 row format delimited  fields terminated by ',' 
 collection items terminated by '_' 
 map keys terminated by ':' 
 lines terminated by '\n';

字段解释:

row format delimited fields terminated by ','  -- 列分隔符

collection items terminated by '_'   --MAP STRUCT 和 ARRAY 的分隔符(数据分割 符号)

map keys terminated by ':'    -- MAP 中的 key 与 value 的分隔符

lines terminated by '\n';     -- 行分隔符 

导入数据:load data local inpath '/opt/temp/hive/datastruct.txt' into table personInfo;

Hive数据类型

Hive数据类型

四、类型转化 

1、隐式类型转换规则如下 

(1)任何整数类型都可以隐式地转换为一个范围更广的类型,如 TINYINT 可以转换
成 INT,INT 可以转换成 BIGINT。 
(2)所有整数类型、FLOAT 和 STRING 类型都可以隐式地转换成 DOUBLE。 
(3)TINYINT、SMALLINT、INT 都可以转换为 FLOAT。 
(4)BOOLEAN 类型不可以转换为任何其它的类型。 

2、可以使用 CAST 操作显示进行数据类型转换 

例如 CAST('1' AS INT)将把字符串'1' 转换成整数 1;如果强制类型转换失败,如执行CAST('X' AS INT),表达式返回空值 NULL。