Gartner:数据仓库设备不是万灵丹

来源: TechTarget
2010/5/14 14:29:00
数据仓库设备模型的概念在近几年来一直是很热门的话题,它对于你的数据仓库性能改善究竟能起到多大的作用,各大厂商可不会告诉你真相。

分享到: 新浪微博 腾讯微博
本文关键字: 数据仓库设备

数据仓库设备模型的概念在近几年来一直是很热门的话题,它对于你的数据仓库性能改善究竟能起到多大的作用,各大厂商可不会告诉你真相。

Gartner研究机构的分析师Donald Feinberg认为,尽管数据仓库设备的确减少了硬件配置的需求,但是它们并不会自动地解决其他一些问题,比如数据仓库设计和数据仓库性能等。

而这也是几大数据仓库厂商,比如IBM、Oracle、Netezza等正在宣传的神话,Feinberg说:“这些厂商会向客户声明,如果你的数据仓库遇到了性能问题,那就意味着你没有满足终端用户的服务等级协议(SLA)。如果你使用数据仓库设备,这样的问题就可以得到解决。说实话,这完全是在胡扯。”

Feinberg表示一个传统的数据仓库如果充斥着不正确的汇总数据,或者缺乏足够的cube来进行数据分析和数据挖掘的话,这不是简单地购买一个数据仓库设备能解决的。他说:“如果我的数据仓库设计得十分糟糕,那我将这个数据仓库迁移到所谓的设备中时,设备不会自动地调整性能问题。”

换句话说,对于设计糟糕的数据仓库来说,在高度的工作负载压力之下是没有快速解决办法的。而工作负载是在逐步加大的,过去几年的趋势就是这样。

数据仓库在最早出现的时候,被视为一个报表工具,其中的数据是批量集成的,公司使用数据仓库的频率也不是很高,通常是每周才使用一次。而经过了数年的发展,随着前端商业智能工具的逐步成熟以及实时数据集成需求的增长,企业对数据仓库的性能要求也越来越高。

Feinberg表示:“我们从之前的只运行几个报表到现在要运行数千个报表,做复杂查询的人也越来越多,甚至达到了一个难以想象的数字,而其中还有的查询会占用极长的时间。于是用户开始关心性能问题了。”

以数据仓库设备的形式添加更多的硬件是无济于事的。性能问题的改善也只是暂时的,当用户的数量增加的时候,这只会造成更大的性能问题。

想要解决性能问题的最佳方法,就是分优先级地使用数据仓库。Feinberg认为:“在解决性能问题时,我们不应该这么看,即谁能最快地加载数据和执行查询,而应该是谁能在最小的投入下完成全部的工作负载。那么这就涉及到工作负载管理的问题了。”

对此,Feinberg指出,目前只有一家厂商提供了全面的工作负载管理工具,那就是Teradata。其竞争对手Oracle、IBM以及微软等都在努力追赶,但是他们想要推出像Teradata一样的工具还需要几年的时间。工作负载管理的空白正在逐渐消失。

另一个选择就是软件外包,把工作负载工具的开发外包给Kognitio或1010data这样的厂商。这些厂商可以把客户的数据仓库迁移到自己的数据中心当中,而这个数据中心就是设计用来优化数据仓库性能的。

这对于那些缺乏IT开发人员的公司来说是一个不错的选择,他们往往无法在内部管理好他们的数据仓库。但是这也有它相应的缺点,最大的问题就是成本,没有外包的数据仓库,IT人员可以对用户访问数量和时间进行内部控制,但是在外包环境中,一个人在两天时间里就可以把一个月的预算全部花费掉。

责编:王立新
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
IT系统一体化时代来了

2009年Oracle 用Exadata服务器告诉企业,数据中心的IT服务一体化解决方案才是大势所趋,而当前企业对大数据处理的..

高性能计算——企业未来发展的必备..

“天河二号”问鼎最新全球超级计算机500强,更新的Linpack值让世界认识到了“中国速度”。但超算不能只停留于追求..

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map