实时数据整合的大买卖——看IBM购买DataMirror

作者:刘庆
2007/8/1 17:21:31
本文关键字: 业内新闻

IBM收购了DataMirror,花了1.6亿,美刀。

DataMirror,从名字也就可以看出他们是干什么的,复制数据呗,专用术语叫做CDC,变化数据捕捉(Changed Data Capture),主要用在实时数据整合方面。这是相对通常的批量数据整合ETL而言的。还记得04年的时候,IBM的另一动作,收购ETL厂商Asential,将Datastatge等产品一股脑纳入他的产品体系里面。

IBM现在正在鼓吹Dynamic Data Warehouse,所谓动态,也就是实时,得有实时的数据整合产品。其实,一早他们就有这类产品的,不过看来DataMirror在这方面还是技高一筹。

同样在鼓吹类似实时数据仓库的还有Teradata,他们的概念叫做Active Data Warehouse,不好翻译,有时候听说叫做活动数据仓库,有时候叫做主动数据仓库。Teradata也有自己的实时数据整合工具,上次听说了一耳朵,没记住。但据说专门搞实时数据整合的一家厂商,叫GoldenGate的,前段时间给他们培训呢。我想,这个GG加入进来,也是一起忽悠主动数据仓库的吧。Google一下,发现原来他们俩早在04年底的时候就达成一项协议,说是全球合作

传统的数据仓库已经满足不了这些大厂的胃口,去年年底或是今年年初的时候,也跟客户忽悠实时数据仓库。"要比竞争对手更快掌握情报,作出决策,就要实时的数据采集,就要实时的数据仓库..."一直怀疑这样说是不是有道理。曾经举出很多需要实时决策的应用,但大多情况并不是需要一个实时的数据仓库。

数据仓库保存历史数据,用来分析,辅助决策。这个过程是从数据中提取知识的过程,并不需要实时数据。

实时数据是需要的,但不是放到数据仓库里面,而是作为一种参数样的东西,作为决策的依据。知识、模式、模型这种东西本身的特性就是不易变的,不用实时的。即便,最新的数据不符合预定的模式,也不能说明这个模式就是错的。只能说再搜集更多最新数据以后,重新调整模型。

到现在我还没弄明白实时数据整合跟数据仓库到底是怎么走到一起的。但现状是,大凡数据仓库厂商都喜欢忽悠这个概念,所以,也可能不是我不明白,是这世界变化快。

责编:刘庆
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
畅享
首页
返回
顶部
×
畅享IT
    信息化规划
    IT总包
    供应商选型
    IT监理
    开发维护外包
    评估维权
客服电话
400-698-9918
Baidu
map