当前位置：首页> 网络&安全> 网安资讯> 正文

大数据时代：企业如何赢得竞争优势

来源：开云全站app

2012/10/18 15:14:18

大中小

研究人员发现，相对简单的算法适用于大规模数据集，并能产生惊人的结果。其中一个例子就是scene completion技术，它使用一个算法来消除图片上的某物（例如汽车），然后从成千上万的图片资料库中寻找合适的照片进行“修补”,当图片资料库的照片增加到数百万时，该算法表现不佳。当拥有足够的数据，这种简单的算法表现极为出色。寻找模式以及“修补”技术是当今很多数据分析应用程序的共同主题。

分享到：新浪微博腾讯微博

本文关键字：大数据 Hadoop

我们已经进入了“大数据时代”,2011 IDC Digital Universe报告说，数据增长的速度已经超过了摩尔定律（Moore's Law）。这种趋势表明企业处理数据模式的转变，即隔离的孤岛正在被大型集群服务器所取代，这种服务器集群将数据与计算资源保存在一起。

从另一种角度来看这种模式转变，这种转变表明数据增长的速度和数据量需要一种新的网络计算方法。在这方面，谷歌就是一个很好的例子。早在1998年谷歌推出测试版搜索引擎时，雅虎公司占主导地位，其他竞争者还包括infoseek、Lycos等，而在短短两年内，谷歌就成为主导搜索引擎供应商。直到2003年，谷歌发布一份关于MapReduce的文件，我们才有幸窥见到谷歌的后端架构。

谷歌的架构显示了该公司如何能够索引更多数据，以更快地获得搜索结果，以及比所有竞争对手更有效和更具成本效益地获取这些结果。谷歌做出的转变是将复杂的数据分析任务分成简单的子任务，这些子任务在并行商品服务器中执行。单独进程被用于映射Map这些数据，然后将其缩小Reduce到中期或最终结果。这种MapReduce框架最终通过Apache的Hadoop供企业使用。

Hadoop简史

在2003年阅读了谷歌的文件后，雅虎工程师Doug Cutting开发了基于Java的MapReduce,将其命名为Hadoop.在2006年，Hadoop成为Apache软件基金会Lucene（一种流行的全文检索库）的子项目，并在2008年成为顶级Apache项目。

从本质上讲，Hadoop提供了对大型商品计算机集群间的捕捉、组织、存储、搜索、共享、分析和可视化不同数据源（结构化、半结构化和非结构化），并能够从几十台服务器扩展到上千台服务器，每台服务器都提供本地计算和存储。

Hadoop包含两个基本组成部分：首先是作为主要存储系统的Hadoop分布式文件系统（HDFS），HDFS复制和分发源数据块到服务器集群的计算节点，以由一个或多个应用程序进行分析。其次是MapReduce,它创建了一个软件框架和编程模型，用于编写能够并行处理大量分布式数据的应用程序。

Apache Hadoop的开源性质创建了一个生态系统，使其功能、性能、可靠性和易用性都不断进步。

保持简单性和可扩展性

在名为“数据不合理的有效性”的文章中，来自谷歌的研究人员将简单的物理方程式（例如E = mc2）与其他学科对比，并指出，“涉及人类而非基本粒子的科学更适合使用简单的数学算法”

事实上，简单的公式完全能够解释复杂的自然世界，以及理解难以捉摸的人类行为，这也是为什么Hadoop普及的原因。

责编：孔维维

微信扫一扫实时了解行业动态

微信扫一扫分享本文给好友

收藏到畅享打印全文复制链接添加到收藏投稿邮箱

分享到：新浪微博腾讯微博

著作权声明：kaiyun体育官方人口文章著作权分属kaiyun体育官方人口、网友和合作伙伴，部分非原创文章作者信息可能有所缺失，如需补充或修改请与我们联系，工作人员会在1个工作日内配合处理。

文章: 物资管理八百客润乾报表伟库网 Xtools 中服软件中机盛科

用友T系列知识管理 ERP
软件: 用友中服软件 SAP 源天软件 Xtools 中机盛科

大数据时代：企业如何赢得竞争优势

通过咨询项目或年度顾问方式，帮助您架起业务和IT的桥梁，解决业务和IT创新融合、现有系统取舍难、IT架构、建设路径、IT治理、IT支出优化等IT策略问题。

与您签订总包或三方合同，帮您解决业务和IT规划落地走样、IT详细设计缺失、难以寻觅靠谱的技术供应商、多个供应商协调难、维护升级服务保障难等棘手问题。

与您签订监理合同，以里程碑专家评审、项目变更协调、风险控制研讨、供应商关系协调、CIO智力网络等为主要服务内容，与甲乙方一起实现上线成功。

畅享IT帮助寻找可靠的、性价比高的开发力量，签订外包合同或三方合同，为企业提供可信赖的开发量，为IT供应商解决开发力量不足的问题。

畅享IT帮助寻找靠谱的、性价比高的维护力量，签订外包合同，对客户满意度负责，为客户解决维护运营服务保障难的问题。

对IT系统、IT项目或IT管理进行评估，出具中立评估报告，解决IT评价难、取舍难的问题。