Hive学习笔记 —— Hive的数据类型
Hive本质上是一个数据库,可以创建表,表有列组成,而列支持的主要类型有:基本数据类型、复杂数据类型、时间数据类型。
1. Hive的数据类型之基本数据类型
- tinyint/smallint/int/bigint:整数类型
- float/double:浮点数类型
- boolean:布尔类型
- string:字符串类型
varchar(20):能存储小于 20 个字符的数据
char(20):存储的大小固定为 20 个字符
2. Hive的数据类型之复杂数据类型
- Array:数组类型,由一系列相同数据类型的元素组成
- Map:集合类型,包含 key -> value 键值对,可以通过 key 来访问元素
- Struct:结构类型,可以包含不同数据类型的元素。这些元素可以通过“点语法”的方式来得到所需要的元素。
创建表
存储结构是这样的:{1, Tom, <‘数据结构’, 80>}
存储结构是这样的:{1, Tom, [<‘数据结构’, 80>, <‘程序设计’, 90> ]}
存储结构是这样的:{1, {‘Tom’, 10, 男}}
3. Hive的数据类型之时间数据类型
-
Date:从 Hive 0.12.0 开始支持,格式:YYYY-MM-DD
【格林威治时间自1970年1月1日(00:00:00 GMT)至当前时间的总秒数。通俗的讲,时间戳是一份能够表示一份数据在一个特定时间点已经存在的完整的可验证的数据。】
-
Timestamp:从 Hive 0.8.0 开始支持,时间戳,一串数字,从