Greemplum高级篇_Greenplum企业应用实战

第9章 数据库管理
9.1 greenplum数据库逻辑结构
Greemplum高级篇_Greenplum企业应用实战

第10章 数据库监控及调优
10.2 安装performance monitor
Greenplum自带了performance monitor,可用它收集当前数据库中sql信息和系统性能的指标,以图形方式展现出来,还会收集master和所有segment的信息。

10.4 vacuum系统表
Greenplum中所有delete并没有删除数据,而是将这一行数据标记为删除;对于OLAP,大部分表是一次导入后不再修改,故不会有这个问题,但对于数据字典,随着时间表越来越大,数据垃圾也越来越多。
基于此,greenplum提供了一种VACUUM的工具,可回收已删除行占据的存储空间。

第14章 基于greenplum的海量数据实时分析服务平台
Greenplum实时化方案主要解决两个问题:

  1. 能对海量数据进行报表计算,要求后端数据做到分钟级别的更新,响应时间在分钟以内
  2. 能对海量数据进行一些简单查询,如kv查询,或对上百条数据进行简单汇总等,响应时间要求在毫秒级别
    一般系统将两者分开,前者对应一些报表数据库,用于分析,后者一般用noSQL,或对MySQL进行分库分表
    Greemplum高级篇_Greenplum企业应用实战
    NoSQL优势主要在键值查询,高并发,高可用,高可扩展性;分布式数据库优势在于查询功能强大,技术方案成熟,天然支持聚合计算和关联分析,但在可用性,可扩展性,并发性及查询性能方面略差;而分表分库是介于noSQL和分布式数据库方案间的一种折中方案。