当前位置：首页> 存储> 大数据> 正文

Hadoop2.0版本将发大数据新突破在即

来源：和讯网

2013/5/30 15:53:34

大中小

以往Hadoop似乎就是大数据的代名词。不过最近随着大数据应用的深入，大家已经越来越倾向于仅仅把它看成是大数据的一个存储工具了。

分享到：新浪微博腾讯微博

本文关键字：大数据 Hadoop2.0

　　以往Hadoop似乎就是大数据的代名词。不过最近随着大数据应用的深入，大家已经越来越倾向于仅仅把它看成是大数据的一个存储工具了。

　　不过这并不一定就是坏事。把Hadoop当作廉价有效的存储正好是Hadoop下一阶段演进的的完美起点。今年夏天就要亮相的Hadoop 2.0将会令数据仓库中的信息以及非结构化数据池前所未有地容易访问。

Hadoop大桶

　　自成为大数据工具以来，Hadoop就是一个非常棒的数据存储系统，但是需要开发Java应用来访问数据的MapReduce学习起来却比较困难。

　　当然，还有别的办法可以从Hadoop中获取信息。Hbase数据是Hadoop的一部分，它可以让用户按照数据库范式来处理数据。Hive数据仓库则可以让你用类SQL的HiveSQL查询语言来创建查询并转化为MapReduce任务。不过Hadoop仍受限于单线程性。MapReduce任务、 Hive查询、Hbase操作，等等，这些都要轮流进行。

　　这就是许多大数据供应商倾向于仅将Hadoop当作数据容器的原因，为了提高效率，他们在此基础上再开发自己的工具来获取或分析其中的数据。尽管把Hadoop形容为一个大桶很形象，但是Hadoop用户当中已经有人把它看作是数据大湖甚至数据海洋了。不过光是规模大还是不行的，那些限制影响到了Hadoop的卖点。

　　Hadoop的开发社区也意识到这个问题，随着Hadoop即将迭代到新的版本，上述限制即将在很大程度上被解除。

YARN解决方案

　　在Hadoop 2.0发布经理Arun Murthy看来，其最重要的变化是MapReduce框架升级为Apache YARN，这将扩展Hadoop中可以应用的软件种类和应用程度。Arun Murthy本人就是YARN项目主管，他指出，Hadoop 1.0和2.0的区别在于，前者所有的事情都是面向批处理的，而后者则允许多个应用同时在内部访问数据。

　　相对于当前MapReduce系统能处理的事情，把这些功能分开使得Hadoop集群资源的管理更加强大。其主要管理方式类似于操作系统对任务的处理，也就是说不再有一次一项操作的限制了。

　　有了YARN，开发者就能够直接在Hadoop内部来开发应用，而不是像许多第三方工具所做的那样，在外面把数据筛选出来。

　　Murthy称，现在已经有供应商对在YARN框架内开发应用表现出兴趣。Murthy估计，Hadoop 2.0的强力beta版有可能会在今年6月或7月推出，正式版则可能在8月发布。

　　如果YARN的确能履行其承诺的话，开发者将可以在原生的Hadoop平台里方便地接触到许多的数据大湖大海，令搜寻有用信息的任务更加流畅和便捷。届时，大数据会变得更加有用、更加大众化。

责编：李红燕

微信扫一扫实时了解行业动态

微信扫一扫分享本文给好友

收藏到畅享打印全文复制链接添加到收藏投稿邮箱

分享到：新浪微博腾讯微博

著作权声明：kaiyun体育官方人口文章著作权分属kaiyun体育官方人口、网友和合作伙伴，部分非原创文章作者信息可能有所缺失，如需补充或修改请与我们联系，工作人员会在1个工作日内配合处理。

Hadoop2.0版本将发大数据新突破在即

Hadoop大桶

YARN解决方案

通过咨询项目或年度顾问方式，帮助您架起业务和IT的桥梁，解决业务和IT创新融合、现有系统取舍难、IT架构、建设路径、IT治理、IT支出优化等IT策略问题。

与您签订总包或三方合同，帮您解决业务和IT规划落地走样、IT详细设计缺失、难以寻觅靠谱的技术供应商、多个供应商协调难、维护升级服务保障难等棘手问题。

与您签订监理合同，以里程碑专家评审、项目变更协调、风险控制研讨、供应商关系协调、CIO智力网络等为主要服务内容，与甲乙方一起实现上线成功。

畅享IT帮助寻找可靠的、性价比高的开发力量，签订外包合同或三方合同，为企业提供可信赖的开发量，为IT供应商解决开发力量不足的问题。

畅享IT帮助寻找靠谱的、性价比高的维护力量，签订外包合同，对客户满意度负责，为客户解决维护运营服务保障难的问题。

对IT系统、IT项目或IT管理进行评估，出具中立评估报告，解决IT评价难、取舍难的问题。

Hadoop2.0版本将发 大数据新突破在即

Hadoop大桶

YARN解决方案

通过咨询项目或年度顾问方式，帮助您架起业务和IT的桥梁，解决业务和IT创新融合、现有系统取舍难、IT架构、建设路径、IT治理、IT支出优化等IT策略问题。

与您签订总包或三方合同，帮您解决业务和IT规划落地走样、IT详细设计缺失、难以寻觅靠谱的技术供应商、多个供应商协调难、维护升级服务保障难等棘手问题。

与您签订监理合同，以里程碑专家评审、项目变更协调、风险控制研讨、供应商关系协调、CIO智力网络等为主要服务内容，与甲乙方一起实现上线成功。

畅享IT帮助寻找可靠的、性价比高的开发力量，签订外包合同或三方合同，为企业提供可信赖的开发量，为IT供应商解决开发力量不足的问题。

畅享IT帮助寻找靠谱的、性价比高的维护力量，签订外包合同，对客户满意度负责，为客户解决维护运营服务保障难的问题。

对IT系统、IT项目或IT管理进行评估，出具中立评估报告，解决IT评价难、取舍难的问题。

Hadoop2.0版本将发大数据新突破在即