BI设计:三个仓库两个通道一个规则

来源: IT168
2011/5/11 10:26:33
数据源就是BI系统所需要用到的原始数据。临时存储区域是数据源的一个子集,其作用是承上启下,便于目标仓库对数据的运算。

分享到: 新浪微博 腾讯微博
本文关键字: BI设计 数据分析

二个通道:数据包通道和数据流传输通道

从上面三个数据仓库的分析中可以知道,不同的数据仓库之间需要有数据的流转。他们是如何来进行流转的呢?通道就是用来解决这个问题。

首先是从数据源仓库转到临时存储仓库,此时使用的主要是数据包通道。从上面的分析中可以得知,在这个数据通道中,没有用到任何的条件、逻辑运算等等,其只是数据源仓库的一个简单的子集。如可能只是抽取了数据源仓库中某几张表、或者某张表中的部分字段等等。其与数据源中的数据是完全一致的。这是由于这个原因,为此临时存储仓库中的数据有很好的公用性。

如现在临时存储区域中有个价格表。在采购成本分析、供应商考核报表中都需要使用到这个价格表。此时项目管理员就可以直接读取临时存储区域中价格表的信息,而不用再舍近求远,从数据源那边去获取。对于数据包通道我们可以理解为一个搬运工,其只是数据简单的迁移,并不会对数据进行任何的操作。其搬移前后的数据应该是相同的。如果不相同,那就犯错误了。

数据流通道其作用是将临时存储区域中的数据迁移到目标数据库中。笔者这里采用了迁移,而不是搬移。这两个词在中文词典上还是有一定的差异。迁移表示其迁移前后的数据会有所不同。其实在这个迁移的过程中,还同时伴随这一个规则,即如何对数据处理的设置。具体的内容,笔者在一个规则的描述中会谈到。在这里笔者认为大家只需要知道,临时存储区域中的数据经过一定的处理之后才会被转送到数据流通道中。或者说,数据流通道中会伴随着一些规则的应用。

一个规则:对数据的分析以及过滤

如果用户看到的最终数据,只是对原始数据的截取,那么BI系统也就没有存在的必要了。BI系统的核心功能就是对原始数据的统计分析。简单的说,就是对数据源中的几张表进行统计、分析、逻辑运算、过滤等等。如在分析交货及时率时,就需要对销售订单、出货单据等等表格进行联合查询,并加以一定的判断与逻辑运算,最后才得到用户所想要的结果。这些运算、过滤的条件统称为规则。其实我们大部分的BI设计工作,都是围绕这个规则所展开的。

另外需要提醒的是,规则只有在数据流传输通道中才会应用。而在数据包传递过程中不会采用任何的规则。这主要是因为BI系统只是一个数据分析的过程,并不会也不能够对原始数据进行任何的更改。即使简单的数据类型调整,也都是在数据流传输通道中完成。为了保障原始数据不被无意的更改,就禁止来数据包传递通道中采用任何的规则。从这个角度来看,临时存储区域其实也有一个保护数据源不被更改的作用。

共2页: [1]2 下一页
责编:刘书畅
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
畅享
首页
返回
顶部
×
畅享IT
    信息化规划
    IT总包
    供应商选型
    IT监理
    开发维护外包
    评估维权
客服电话
400-698-9918
Baidu
map