不要让Hadoop炫酷的因素冲昏头脑

来源: 中国商业智能网
2011/11/15 0:00:00
Forrester研究公司警告说,企业在开发技术时,应有业务为中心的视角。

分享到: 新浪微博 腾讯微博
本文关键字: BI Hadoop
分析公司Forrester研究于周二发布的一份新报告呼吁说,企业应该采取务实的态度为“大数据”的需求安装Hadoop。
这一指导是基于一些早期的Hadoop采用者(包括雅虎、AOL、Mozilla和Klout)的经验。它提醒企业不要被一些围绕技术的炒作冲昏了头,并倡导一种纯粹由业务目标所驱动的分阶段式的Hadoop部署。
要避免缺乏商业价值的Hadoop“科学工程”,报告指出。“当心不要将Hadoop技术层面的炫酷因素和一种真正交付实际业务价值的业务例案相混。”
Hadoop是设计用来帮助 企业管理和处理非常大量数据的一种开源技术。Hadoop越来越流行的大部分原因在于它能把大数据集分成小的数据块,然后再将它们分布在一群通用硬件上以便更快地处理。
早期的采用者一直在使用Hadoop存储和分析大量 其它企业数据仓库技术无法容易处理的非结构化数据。它是一种越来越受到供应商支持的开源技术。这一事实大大地促进了它在企业中不断增长的吸引力。
“Hadoop是企业数据仓库的Linux,”一位Forrester公司的分析师以及该报告的作者之一的JamesKobielus说。“和早期的Linux一样,它正被采纳并分叉和修正并优化”。
Kobielus说,企业对Hadoop寄予厚望,特别是基于云的环境下。它是一种从开始起就不仅仅是一种数据仓库的架构。不同于传统关系型数据库技术处理结构化的、关系型数据,Hadoop是一种处理大量复杂的非结构化的数据的架构。
即便如此,它仍然是有待于改进的技术。Hadoop的相对新颖,它的不成熟,缺乏标准,相对缺少商业产品和技能的适用性,所有这些对企业来说都造成大的挑战。
这份Forrester公司的报告概括了一套最佳实践,Kobielus说企业可以用它来指导他们的Hadoop部署。
有一个建议是针对企业如何将Hadoop方案与一种清晰的大数据业务策略相匹配,Kobielus说。IT经理需要确定Hadoop能提供清晰的效益的具体业务情况。例如,雅虎在使用Hadoop的业务案例中,Hadoop一直在为广告布局支持在大数据集上的分析,Kobielus说。
企业在实施Hadoop时需要有类似的特定目标。在大多数情况下,最好从有近期收益和很容易看见切实影响的项目开始。在部署Hadoop之前,也最好看看是否有其它企业数据仓库技术可以处理这些需求。
“只在你的数据量可能会扩充到TB或甚至PB这样的水平时,才探索像Hadoop这样的大数据方法,”其中也包括各种各样的数据类型,Forrester的报告指出。“如果你在 数据存储、计算、以及网络性能上过度投资,就会加到你的成本上而不能带来任何相应的业务效益,”它警告说。
Forrester公司还建议企业使用企业级的平台和工具来提升他们的Hadoop环境。在可能的情况下,公司应对建立和扩充在ApacheHadoop开源分布上的商业产品和工具的功能、可扩展性和成熟进行评估。
有一些包括Hadoop分布的例子来自像Cloudera,EMCGreenplum, IBM和Hortonworks这样的供应商,在有商业选择的时候还尝试建立一种内部的Hadoop开发是不明智的,Forrester报道说。
在如此早期的阶段就彻底标准化或委托给一家供应商的分布也是不明智的,因为在未来几年里市场会如何进展尚不清楚,Kobielus说。
公司也应很好地建立自己的Hadoop的资源中心,Kobielus说。鉴于熟练的Hadoop专业人员的严重短缺,公司应尽可能地尝试培育内部的Hadoop技能。
焦点应集中在数据库管理员和整合专家的技术升级,并让他们熟悉像映射化简(MapReduce)这样的技术。他们也应该更广泛地与Hadoop社区联系以了解最新的最佳实践和发展趋势,Kobielus说。

责编:何先辉
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
畅享
首页
返回
顶部
×
畅享IT
    信息化规划
    IT总包
    供应商选型
    IT监理
    开发维护外包
    评估维权
客服电话
400-698-9918
Baidu
map