企业如何利用大数据“点石成金”?

来源: ZDNet
2012/8/24 9:32:19
在技术领域,大数据无疑是时下最流行的热门词汇之一,然而大数据的含义通常取决于你提问的对象。而事实也证明了,大数据是对我们如何存储和处理数字信息的重新定义,作为IT行业这5年中最主要发展趋势继续流行下去。

分享到: 新浪微博 腾讯微博
本文关键字: 大数据 企业存储

在技术领域,大数据无疑是时下最流行的热门词汇之一,然而大数据的含义通常取决于你提问的对象。而事实也证明了,大数据是对我们如何存储和处理数字信息的重新定义,作为IT行业这5年中最主要发展趋势继续流行下去。当然市场估计是乐观的,最近德勤会计师事务评估大数据市场的规模介于13亿美元到15亿美元之间,而IDC预测到2015年该行业的规模将会高达169亿美元。

但是,庞大的数字往往会掩盖根本性的变化,这似乎正是在大数据热潮下发生的。

企业如何利用大数据“点石成金”?

首先,试图挖掘原始数据并进行处理,然后从发现的东西(特定领域的商业智能)中获得洞察力,相当于试图找到数据来支持已经完成的战略决策。

关于第一类数据的一个比较知名的例子是著名的“点球成金”的故事,就像在2003年出版的由迈克尔?刘易斯讲述的那样,关于如何挑战传统的故事,通过大量数据的分析以找出表现最好的运动员,这个故事相当的成功。这个故事的一个关键点在于,它让很多人相信以数据为先的想法可能会解决许多长期存在的问题,帮助应对从犯罪和疾病到污染和贫困的任何事情。这或许也算是解决我们行业中某些更世俗的挑战的关键。

第二个主要变化是,从把关系型数据模型处理信息的确定标准中脱离出来。可以肯定的是, 尽管像Hadoop这样的新平台,它面向客户的技术日益普及,当NoSQL类型的数据库在互联网新创企业和消费者服务中仍然是最流行的。然而,在许多业务背景下,PB甚至是EB级的数据量要求有能够很好地应对数据迅猛增长而时间缩短等难题的技术。

还有很多例子说明关系模型终于已经遇到对自己的霸权地位的挑战,以及是否能够到更好地处理如今数据量和类型多样化的质疑。尽管许多企业机构将继续使用关系型技术来创造出大数据解决方案,但是随着非结构化数据的增长速度超过比传统结构化数据,它不再是唯一的选择。

第三个变化是朝着使大数据具有更多的操作性组件的方式组织工作和如何面向外部的产品功能。尽管数据科学家经常需要得到最好的结果,他们的研究结果通常是几乎所有人都使用的应用程序或数据器具。就像谷歌使外行用几个关键词查询网络的整个内容,企业大数据的下一代似乎是关于以一种通常不需要信息技术向导的方式连接工人与他们组织的数据景观。因此,基于大数据技术的业务解决方案必须是一个容易接近的关于一线员工平均线的终端用户技术,目的是有一个持续的和有意义的业务影响。

企业利用大数据的现状

让我们看看当今企业机构在谈到大数据的实现和使用时有什么样的反馈。O'Reilly Strata Conference对跨领域的各种规模的企业进行调查,研究今年受访者在大数据方面都有什么动作:

· 18%已经部署大数据解决方案

· 28%此时还没有计划

· 22%计划六个月后将部署大数据解决方案

· 17%计划十二月后将部署大数据解决方案

· 15%计划两年后将部署大数据解决方案

诚然,参加这次调查的受访者采用大数据的比例也许要高于平均值,所以这些数字还是有些乐观的,即使考虑到大数据是一个涵盖处理大数据量和分析等诸多技术的词汇。

然而,当我们看某个特定的领域时会变得更加有趣。例如,保险行业最近报告,15% - 20%的保险公司正积极准备大数据的解决方案。根据麦肯锡关于大数据的报告,作为大数据较大的潜在受益者之一的政府,本身的采用却相对缓慢。最近进行的一次对公共部门CIO和IT经理进行调查显示,他们需要三年时间才能用这种方式开始处理数据。如果我们看看作用,而不是行业,我们可以看到,大数据将带来销售流程的变革。最近CSO Insights的分析显示,71%的公司期望大数据能显著地影响销售,不过目前只有16%的公司这么做,这一差距是许多组织将明显地想要弥补的。

大数据所带来的变化是逐步显现出来的。所有的技术、流程、基础设施和管理都必须放在合适的位置,加上了解你业务(或学会)的数据科学家,以及DevOps这种仍然深奥的概念,这将使大数据的操作与开发通过应用数据分析结合,通过运用数据为先的分析原则,加上及时的研发和部署,快速解决业务问题。

此外,企业还将必须提供一个大数据“堆栈”。这个堆栈将通常是由以下组件构成,涉及包括开源软件、商业应用、预置的云基础设施,结合不同来源的数据。

破解企业大数据

· 技术。 一般来说,这些似乎是分解成三个主要组成部分,其中两个是新的,另一个是遗留的。有Hadoop分布式系统和它的变体,结构化查询语言和关系数据库,这增加了大数据的特性。

· 基础设施和开发。这包括基础设施即服务(IaaS)、软件即服务(SaaS)、数据即服务(DaaS)、Open API、DevOps和数据科学家。

· 大数据应用。这个关于大数据流行应用模型的列表,包括商业智能、社会分析、决策支持、可视化和建模、行为预测和业务流程优化(BPO)等等。

· 特定领域的解决方案。一旦大数据技术、基础设施和应用就绪,企业就必须集中精力挖掘在特定行业中的价值。大数据主要集中的行业或功能(最有可能受益),包括营销、研发、科学/技术/工程/数学(STEM)、卫生保健、金融服务、零售和保险。

· 大数据驱动的业务流程。大数据解决方案必须纳入企业机构的业务流程,包括操作、业务线和支持功能。尤其是,高附加值和普通的业务流程将会提供最大的投资回报率。

总而言之,对于日益增长的海量数据来说,大数据仍处于初期阶段。大多数企业机构在规模上还没有涉及大数据,但是对于那些真正需要的人来说,大数据所能带来的优势正在显现出来。从根本上说,最大的挑战将是将大数据有效地整合到不断完善的业务流程中。再次,变化本身将是大范围的,因为技术发展的步伐已经超过大部分企业机构消化吸收这些技术的能力。对于寻找加速采用战略的企业机构来说,这将把数据推入云中,进一步加速云相关的IT变革。这也许不是一件坏事。

责编:赵龙
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map