设计一个数据仓库是业务发展的一个重要部分。对于设计,有两种最常见的架构,即Kimball和Inmon,但问题是哪一种更好,哪一种在低冗余度下为用户服务。让我们在一些因素上对两者进行比较。

1. Kimball: Kimball设计Dataware房屋的方法是由Ralph Kimball提出的。这种方法从认识业务流程和Dataware house需要回答的问题开始。这些信息集正在被分析,然后被很好地记录下来。提取转换加载(ETL)软件从多个数据源带来所有的数据,称为数据集市,然后被加载到一个叫做staging的公共区域。然后,这被转化为一个OLAP立方体。

应用

  • 设置和建立都很迅速。
  • 针对多个星型模式生成报告是非常成功的。
  • 数据库操作非常有效。
  • 在数据库中占有较少的空间,管理也很容易。

Kimball Dataware房子的结构如下所示(这应该被改变。这不是一个Kimball模型。Kimball模型没有集成层。数据直接从源系统移动到数据集市。在Kimball中没有ODS)-
Kimball

2、Inmon: Inmon设计Dataware房屋的方法是由Bill Inmon提出的。这种方法以企业数据模型为起点。这个模型确认了关键领域,也照顾到了客户、产品和供应商。这个模型用于创建一个详细的逻辑模型,用于主要业务。然后,细节和模型被用来开发一个物理模型。这个模型是规范化的,使数据的冗余度降低。这是一个复杂的模型,很难用于商业目的,为此创建了数据集市,每个部门都能为他们的目的使用它。

应用

  • 数据仓库对变化非常灵活。
  • 业务流程可以非常容易理解。
  • 报告可以跨企业处理。
  • ETL过程非常不容易出错。

Inmon数据仓库的架构如下所示-
Inmon数据仓库

Kimball和Inmon的区别如下。

参数 Kimball Inmon
引入 由拉尔夫-金博尔介绍。 由Bill Inmon引入。
Approach Kimball有一个自下而上的实施方法。 Inmon有自上而下的实施方法。
数据集成 Kimball侧重于个别业务领域。 Inmon侧重于企业范围内的领域。
构建时间 Kimball是高效的,需要较少的时间。 Inmon复杂,耗费大量时间。
成本 Kimball有迭代的步骤,具有成本效益。 Inmon初始成本巨大,开发成本低。
所需技能 Kimball不需要这些技能,但一个普通的团队就能完成工作。 Inmon需要专门的技能来实现工作。
维护 Kimball的维护是困难的。 Inmon的维护很容易。
数据模型 Kimball倾向于将数据放在非正常化的模型中。 Inmon更倾向于数据处于规范化的模型中。
数据存储系统 Kimball源系统是高度稳定的。 Inmon源系统的变化率很高。