公共数据仓库模式参考

一.概述

多维数据模型是数据仓库中最流行的数据模型。多维数据模型最典型的数据模型有星形模型、雪花模型和事实星座模型。本文通过实例展示了它们之间的模式和差异。

二、星型模式(star schema)

星型模式的核心是一个大的中心表(事实表)和一组小的附属表(维度表)。星形模式的示例如下:

3.雪花模式。

雪花模式是星型模式的扩展,其中一些维度表被规范化并进一步分解为附加表(维度表)。下图显示了雪花模式的一个示例:

从图中,我们可以看到地址表被进一步细分为城市维度。supplier_type表进一步细分为供应商维度。

4.事实星座或星系模式。

数据仓库由多个主题组成,包括多个事实表,维度表是公共的,可以共享。这种图案可以看作是恒星图案的集合,所以称为星系图案或事实星座图案。下图显示了此模式的一个示例:

如上图所示,事实星座模式包含两个事实表:销售和发货,* * *享受维度表。

动词 (verb的缩写)摘要

事实星座模式是数据仓库中使用时间最长的数据模式,尤其是在企业数据仓库(EDW)中。这也是数据仓库区别于数据集市的典型特征。从根本上说,数据仓库的数据模型更多的是为了避免冗余和数据复用,应用现成的模型来设计数据仓库是最合理的选择。当然,在大数据技术体系下,数据仓库的数据模型设计还是一个盲点,正在探索中。

最近在《大数据技术体系下的数据仓库模型设计》中,我回顾了传统数据仓库的关键技术和数据模型。有兴趣的可以一起讨论,学习一下。