当前位置：首页 > 服务器 > 服务器资讯 > 正文

实力就是魅力 MapReduce成服务器新欢

来源：中关村在线

2011/6/20 22:22:06

大中小

在未来，当管理员搭建服务器的时候，他或者她很可能会给服务器堆栈、数据库、中间件软件装上MapReduce。

分享到：新浪微博腾讯微博

本文关键字：服务器 MapReduce

在未来，当管理员搭建服务器的时候，他或者她很可能会给服务器堆栈、数据库、中间件软件装上MapReduce。

　　加州大学圣地亚哥分校研究员Dionysios Logothetis，在日前举行的Usenix年度会议上表示，MapReduce可以在服务器上直接被用来分析日志数据，无需在各个集群上单独分析，也可以大幅缩短分析数据的时间。

利用该方法，“数据分析可以从专业集群上转移到日志服务器上，从而避免昂贵的数据迁移成本支出，”MapReduce首先是由谷歌公司推出来的，它越来越多地被用来分析跨服务器和节点的大规模数据。目前，它主要担当Hadoop数据处理平台的一个组成部分。

　　虽然MapReduce大部分都使用在专业集群上，但研究人士表示分析软件的框架版本也可以成为网络服务器的一部分。当前，商业网页关于用户的详细日志信息，可以为广告定位、网站安全监控和调试提供数据支持。

　　根据统计，为繁忙的电子商务网站提供服务的单个服务器，在每秒钟时间内能生成1MB至10MB有价值的日志数据。而在一天之内，它可以生成几十兆兆字节有价值的数据量。平均而言，1000台这样的服务器在一天之内能生成86TB容量的数据信息。比如著名的社交网站Facebook一天所产生的数据量为100TB。

　　通常来说，大型公司比如Facebook这样的站点都会收集不同服务器上的数据，然后载入到Hadoop集群并使用 MapReduce分析其结果。

以往“先存储后查询”的方法具有诸多弊端。传输不同服务器上的数据会耗费大量的带宽资源，对网络构成巨大压力。在进行数据分析之前，Facebook会丢弃80%的日志数据。通过使用这种新技术，这些数据就无需再进行传输了，更不会发生数据丢失的严重问题。

　　MapReduce在未来的服务器上可能将会成为一种标准配备，它将对数据进行分析并将分析后的结果传达给中央数据采集点。研究人士将这一方法称之为“in-situ MapReduce (iMR)”。

　　iMR旨在补充而不是取代传统的集群架构，它是为了完成分布式存储系统中的日志数据和其他数据后续分析。作为一项程序，iMR能复制所有的MapReduce APIs，并执行MapReduce相类似的功能、对过滤的数据进行命名并汇集分析结果。不同之处在于，它能基于最新数据的基础上持续进行分析。

　　目前，研究员已经创建了一个iMR原型，通过iMR用户可以指定需要分析处理的数据范围，比如过去60秒钟收集的所有信息。此外，用户还可以设定多久提交一次分析结果并进行传送，比如可以指定每15秒钟分析一次等。

　　MapReduce是一种编程模型，用于大规模数据集（大于1TB）的并行运算。概念“Map（映射）”和“Reduce（化简）” 和他们的主要思想，都是从函数式编程语言里借来的，还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下，将自己的程序运行在分布式系统上。

责编：张欢

微信扫一扫实时了解行业动态

微信扫一扫分享本文给好友

收藏到畅享打印全文复制链接添加到收藏投稿邮箱

分享到：新浪微博腾讯微博

著作权声明：kaiyun体育官方人口文章著作权分属kaiyun体育官方人口、网友和合作伙伴，部分非原创文章作者信息可能有所缺失，如需补充或修改请与我们联系，工作人员会在1个工作日内配合处理。

文章: 物资管理八百客润乾报表伟库网 Xtools 中服软件中机盛科

用友T系列知识管理 ERP
软件: 用友中服软件 SAP 源天软件 Xtools 中机盛科

实力就是魅力 MapReduce成服务器新欢

通过咨询项目或年度顾问方式，帮助您架起业务和IT的桥梁，解决业务和IT创新融合、现有系统取舍难、IT架构、建设路径、IT治理、IT支出优化等IT策略问题。

与您签订总包或三方合同，帮您解决业务和IT规划落地走样、IT详细设计缺失、难以寻觅靠谱的技术供应商、多个供应商协调难、维护升级服务保障难等棘手问题。

与您签订监理合同，以里程碑专家评审、项目变更协调、风险控制研讨、供应商关系协调、CIO智力网络等为主要服务内容，与甲乙方一起实现上线成功。

畅享IT帮助寻找可靠的、性价比高的开发力量，签订外包合同或三方合同，为企业提供可信赖的开发量，为IT供应商解决开发力量不足的问题。

畅享IT帮助寻找靠谱的、性价比高的维护力量，签订外包合同，对客户满意度负责，为客户解决维护运营服务保障难的问题。

对IT系统、IT项目或IT管理进行评估，出具中立评估报告，解决IT评价难、取舍难的问题。