初学数据仓库--简单概念

看一下整个数据仓库的生命周期图

初学数据仓库--简单概念
生命周期图描述了有效地进行DW(data warehouse)/BI(Business Intelligence) 系统的设计开发部署所需的任务的顺序
####维度模型
维度模型的两个基本结构是事实表维度表
事实表的非主键属性称为事实 (Fact),它们一般都是数值或其他可以进行计算的数据; 而维度大都是文字、
时间等类型的数据,按这种方式组织好数据我们就可以按照不同的维(事实表的主键的部分或
全部)来对这些事实数据进行求和(summary)、求平均(average)、计数(count)、百分比(percent)
的聚集计算,甚至可以做20-80 分析。这样就可以从不同的角度数字来分析业务主题的情况,
下面给出一个直观的例子。
初学数据仓库--简单概念
图 16-5 是一个典型的银行贷款分析的模型设计,其中加边框的为主关键字(PK, Primary
Key),其中贷款分析表是一个事实表,其中的贷款授信金额,贷款余额是需要从各角度观察
的数据(事实),而观察的角度是有区域、银行、时间,质量这四个方面组合进行,这些分析
角度的有机组合,可以对授信金额和贷款余额进行4 ╳ 8 ╳ 4 ╳ 8 种组合的数据统计分析,
以此实现对贷款情况的多角度(维)多层次(数据不同的汇总程度)的分析,贷款分析人员既可
以宏观地看到贷款业务的整体情况,又可以微观地观察到具体一家银行一天一类贷款的细节
信息。多维分析的时候,维度选择越多数据越细节(划分得更细了),维度选择越少数据越汇
总越宏观。

这样一个中间一个大表形成主表,周围一组小表与主表相关联的结构,形态上呈星星和雪
花的形状,星型模型是数据仓库的数据模型与其他数据库应用相区分的一个重要特征。
初学数据仓库--简单概念