Vertica数据库介绍
1、简介
Vertica是一款基于列存储的MPP(massively parallel processing)架构的数据库。它可以支持存放多至PB(Petabyte)
级别的结构化数据。
2、特性
1)列式存储
vertica以列格式存储数据, 以便在查 询时获得最佳性能。相比基于行的存储, 列存储可减少磁盘I/O, 非常适合读取 密集型工作负载
2)高级压缩
压缩会将数据转换为紧凑的格式。 Vertica 使用多种不同的压缩方法, 并 且可以根据要压缩的数据自动选择最 佳方法
3)高可用
Vertica 使用类似RAID 的功能为数据库 提供高可用性。
4)自动数据库设计
Vertica数据库参数几乎无需二次配置
5)海量并行处理
支持海量的事务并行分析处理
6)应用程序集成
集成了DBD分析引擎、Vertica MC控制 管理平台、Vertica WLM资源控制、 scheduler任务计划对接kafka等
3、vertica组件介绍
wos:将未经压缩或建立索引的数据存储在内存中。
ros:将数据存储在磁盘上;这些数据会经过分段,排序,压缩,以便提高优化水平
tuple mover
moveout ‐ 将数据从WOS 复制到Tuple Mover, 然后再复制到ROS; 数据在列式文件中会经过排序、编码和压缩
mergeout ‐ 将若干较小的ROS 容器组合成一个较大的容器, 以 便减少碎片
4、vertica数据导入
5、Projection简介
Projection是Vertica 存储数据的方式 – 由一个或多个表中的列集组成
由Vertica 自动维护 – 不进行夜间Projection重建
每个Projection存储单独的数据副本 – 编码和压缩最大程度地降低存储需求
vertica对象层次化: