|
Gartner:数据仓库设备不是万灵丹
数据仓库设备模型的概念在近几年来一直是很热门的话题,它对于你的数据仓库性能改善究竟能起到多大的作用,各大厂商可不会告诉你真相。
本文关键字:
数据仓库设备
数据仓库设备模型的概念在近几年来一直是很热门的话题,它对于你的数据仓库性能改善究竟能起到多大的作用,各大厂商可不会告诉你真相。 Gartner研究机构的分析师Donald Feinberg认为,尽管数据仓库设备的确减少了硬件配置的需求,但是它们并不会自动地解决其他一些问题,比如数据仓库设计和数据仓库性能等。 而这也是几大数据仓库厂商,比如IBM、Oracle、Netezza等正在宣传的神话,Feinberg说:“这些厂商会向客户声明,如果你的数据仓库遇到了性能问题,那就意味着你没有满足终端用户的服务等级协议(SLA)。如果你使用数据仓库设备,这样的问题就可以得到解决。说实话,这完全是在胡扯。” Feinberg表示一个传统的数据仓库如果充斥着不正确的汇总数据,或者缺乏足够的cube来进行数据分析和数据挖掘的话,这不是简单地购买一个数据仓库设备能解决的。他说:“如果我的数据仓库设计得十分糟糕,那我将这个数据仓库迁移到所谓的设备中时,设备不会自动地调整性能问题。” 换句话说,对于设计糟糕的数据仓库来说,在高度的工作负载压力之下是没有快速解决办法的。而工作负载是在逐步加大的,过去几年的趋势就是这样。 数据仓库在最早出现的时候,被视为一个报表工具,其中的数据是批量集成的,公司使用数据仓库的频率也不是很高,通常是每周才使用一次。而经过了数年的发展,随着前端商业智能工具的逐步成熟以及实时数据集成需求的增长,企业对数据仓库的性能要求也越来越高。 Feinberg表示:“我们从之前的只运行几个报表到现在要运行数千个报表,做复杂查询的人也越来越多,甚至达到了一个难以想象的数字,而其中还有的查询会占用极长的时间。于是用户开始关心性能问题了。” 以数据仓库设备的形式添加更多的硬件是无济于事的。性能问题的改善也只是暂时的,当用户的数量增加的时候,这只会造成更大的性能问题。 想要解决性能问题的最佳方法,就是分优先级地使用数据仓库。Feinberg认为:“在解决性能问题时,我们不应该这么看,即谁能最快地加载数据和执行查询,而应该是谁能在最小的投入下完成全部的工作负载。那么这就涉及到工作负载管理的问题了。” 对此,Feinberg指出,目前只有一家厂商提供了全面的工作负载管理工具,那就是Teradata。其竞争对手Oracle、IBM以及微软等都在努力追赶,但是他们想要推出像Teradata一样的工具还需要几年的时间。工作负载管理的空白正在逐渐消失。 另一个选择就是软件外包,把工作负载工具的开发外包给Kognitio或1010data这样的厂商。这些厂商可以把客户的数据仓库迁移到自己的数据中心当中,而这个数据中心就是设计用来优化数据仓库性能的。 这对于那些缺乏IT开发人员的公司来说是一个不错的选择,他们往往无法在内部管理好他们的数据仓库。但是这也有它相应的缺点,最大的问题就是成本,没有外包的数据仓库,IT人员可以对用户访问数量和时间进行内部控制,但是在外包环境中,一个人在两天时间里就可以把一个月的预算全部花费掉。
责编:王立新
微信扫一扫实时了解行业动态
微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
|
最新专题
推荐圈子
|
|