|
Hub&Spoke?goldenfish3 20061208 就是从源系统到一个轻型的数据整合层,再到目标系统的架构。中间这部分是Hub,可以保留短期的历史,进行轻度的整合。针对从源系统直接到目标系统的N*M的数据路径复杂程度来说,这种结构使得数据路径复杂度降低到N+M(如果N个源系统,M个目标系统),具体来说,目标系统需要什么数据的时候,向整合层要,整合层从自己这里先找找有没有,有的话就直接给,不需要目标系统直接向源系统取。 Qing 20061208 对Hub&Spoke这个名词一直迷惑不解,前天看到goldenfish提到这个词,于是请教了他。 看了goldenfish的这段解释之后,我觉得将分散的数据源集中在一起,再发布出去,这是非常容易理解的。但这不就是数据仓库的特点吗,为什么弄出这样一个名词来?如果按照Hub&Spoke的名字顾名思义,大概就是指有个类似Hub的东西,是集线器,先将分散的东西搜集过来,然后再Spoke?这个Spoke是什么意思?说出去?可能是指散布出去的意思吧。那么Hub&Spoke是否就可以翻译成为"集中起来再发散出去"。 今年1月份的时候,曾经在一篇论述数据仓库度量指标的文章里面提到这个词,摘出来看看: > ... 参见: 这里面,比较了总线架构、CIF(似乎就是指Hub&Spoke)以及集中式非独立数据集市三种架构,相对要比联邦数据仓库以及独立数据集市两种架构的效果要稍好一些。 如果说总线架构,是利用一致性维度将数据集市联系起来,还不算是"集中起来发散出去",但CIF明显是的,他提倡要有一个EDW。而集中式非独立数据集市呢,从名字上,有个"集中",似乎也是"Hub&Spoke"啊。哦,难道是指他只是集中起来,但没有发散出去?头晕了。 能不能请goldenfish、innovate、jerome等架构大侠,对现有数据仓库的若干种架构作个讨论,到底分成几种?每种的异同?适合于什么场合? innovate511 20061209 IBMCDW架构中就是这个作用,它之前是Inmon派的EDW数据整合层,之后是Kimball派的数据集市构建方案,而因为数据集市直接来自EDW的话,问题会很多,架构很难支撑长远的更复杂的需求,灵活度差,于是就有了这个思想。
责编:姜玲
微信扫一扫实时了解行业动态
微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
|
热门博文
|
|