Vertica数据库介绍

1、简介

         Vertica是一款基于列存储的MPP(massively parallel processing)架构的数据库。它可以支持存放多至PB(Petabyte)

级别的结构化数据。

2、特性

 1)列式存储

        vertica以列格式存储数据, 以便在查 询时获得最佳性能。相比基于行的存储, 列存储可减少磁盘I/O, 非常适合读取 密集型工作负载

2)高级压缩

       压缩会将数据转换为紧凑的格式。 Vertica 使用多种不同的压缩方法, 并 且可以根据要压缩的数据自动选择最 佳方法

3)高可用

      Vertica 使用类似RAID 的功能为数据库 提供高可用性。

4)自动数据库设计

      Vertica数据库参数几乎无需二次配置

5)海量并行处理

       支持海量的事务并行分析处理

6)应用程序集成

      集成了DBD分析引擎、Vertica MC控制 管理平台、Vertica WLM资源控制、 scheduler任务计划对接kafka等

3、vertica组件介绍

       wos:将未经压缩或建立索引的数据存储在内存中。

       ros:将数据存储在磁盘上;这些数据会经过分段,排序,压缩,以便提高优化水平

       tuple mover

            moveout ‐ 将数据从WOS 复制到Tuple Mover, 然后再复制到ROS;  数据在列式文件中会经过排序、编码和压缩

            mergeout ‐ 将若干较小的ROS 容器组合成一个较大的容器, 以 便减少碎片

 4、vertica数据导入

    Vertica数据库介绍

  5、Projection简介

            Projection是Vertica 存储数据的方式 – 由一个或多个表中的列集组成

            由Vertica 自动维护 – 不进行夜间Projection重建

            每个Projection存储单独的数据副本 – 编码和压缩最大程度地降低存储需求

Vertica数据库介绍

vertica对象层次化:

Vertica数据库介绍