“数”中自有黄金屋 EMC、IBM等掘金大数据

来源:ctocio  
2011/12/2 16:34:55
随着大数据需求的不断爆发,将加速各大IT公司在这一领域的收购步伐,一些提供单一技术方案的IT公司,很可能难逃被收购的命运。

本文关键字: 大数据 大数据市场 EMC IBM

3月11日日本大地震发生后仅9分钟,美国国家海洋和大气管理局(NOAA)就发布了详细的海啸预警。随即,NOAA通过对海洋传感器获得的实时数据进行计算机模拟,制作的海啸影响模型出现在YouTube等网站。

NOAA 的快速反应得益于其全球范围内庞大的海洋传感器网络。通过这些置于海面和海底的传感器,NOAA源源不断地获取全球范围的海洋信息,并将这些信息存储在位于美国新泽西州的数据中心。NOAA的数据中心存储着超过20Pb(1024Tb)的数据,是美国政府最大的数据库之一。

NOAA海啸开云全站官方下载 首席科学家Vasily Titov事后向外界表示,“虽然预警系统发挥了很大价值,但是还没有快到足以帮助到日本仙台沿海的居民及时躲避海啸”。为了在更短时间内分析出准确的海啸活动趋势,NOAA一直在努力提升其对大数据进行处理的能力——这一机构每年的IT预算高达10亿美元。

虽然花费巨大,NOAA却对此乐此不疲,因为数据关乎生命。同样专注于大数据投入的还有很多商业机构,比如eBay、沃尔玛、中国移动等。他们大都希望从海量的大数据中,挖掘更多的商业价值,这关乎这些企业能否在大数据时代继续保持基业常青。

对于任何企业来说,数据都是其商业皇冠上最为耀眼夺目的那颗宝石。伴随着传统的商业智能系统向纵深应用的拓展,商业决策已经越来越依赖于数据。然而,传统的商业智能系统中用以分析的数据,大都是企业自身信息系统中产生的运营数据,这些数据大都是标准化、结构化的。事实上,这些数据只占到了企业所能获取的数据中很小的一部分——不到15%。

通常情况下,企业的数据可以分为3种类型:结构化数据、半结构化数据和非结构化数据。其中,85%的数据属于广泛存在于社交网络、物联网、电子商务等之中的非结构化数据。这些非结构化数据的产生往往伴随着社交网络、移动计算和传感器等新的渠道和技术的不断涌现和应用。企业用以分析的数据越全面,分析的结果就越接近于真实。大数据分析意味着企业能够从这些新的数据中获取新的洞察力,并将其与已知业务的各个细节相融合。

IDC 在其关于大数据的报告中,阐述了利用大数据的商业价值:领军企业与其他企业之间最大的显著差别在于新数据类型的引入。那些没有引入新的分析技术和新的数据类型的企业,不太可能成为其行业的领军者。

美国奥巴马总统委员会的科学技术(PAST)顾问、Teradata公司首席技术官Stephen Brobst告诉《商业价值》记者:“过去3年里产生的数据量比以往4万年的数据量还要多,大数据时代的来临已经毋庸置疑。我们即将面临一场变革,新兴大数据将成为企业发展的当务之急,而常规技术已经难以应对Pb级的大规模数据量。这一变化所带来的挑战,是成功的企业在未来发展过程中必须要面对的。只有那些能够运用这些新数据型态的企业,方能打造可持续的重要竞争优势。”

“数”中黄金屋

沃尔玛是最早通过利用大数据而受益的企业之一,一度拥有世界上最大的数据仓库系统。通过对消费者的购物行为等非结构化数据进行分析,沃尔玛成为最了解顾客购物习惯的零售商,并创造了“啤酒与尿布”的经典商业案例。早在2007年,沃尔玛就建立了一个超大的数据中心,其存储能力高达4Pb以上。《经济学人》在2010年的一篇报道中指出,沃尔玛的数据量已经是美国国会图书馆的167倍。

中国移动集团山西有限公司通过大数据分析,对企业运营的全业务进行针对性的监控、预警、跟踪。系统在第一时间自动捕捉市场变化,再以最快捷的方式推送给指定负责人,使他在最短时间内获知市场行情。

“全面获取业务信息非常重要,有时候甚至能颠覆常规分析思路下做出的结论。” 中国移动集团山西有限公司业务支撑系统部经理王峰说。比如,一个客户使用最新款的诺基亚手机,每月准时缴费、平均一年致电客服3次,使用WEP和彩信业务。如果按照传统的数据分析,可能这是一位客户满意度非常高、流失概率非常低的客户。事实上,当搜集了包括微博、社交网络等新型来源的客户数据之后,这位客户的真实情况可能是这样的:客户在国外购买的这款手机,手机中的部分功能在国内无法使用,在某个固定地点手机经常断线,彩信无法使用——他的使用体验极差,正在面临流失风险。

“我们正在打破传统数据源的边界,更加注重社交媒体等新型数据来源。通过各种渠道获取尽可能多的客户信息,并从这些数据中挖掘更多的价值。”王峰说。

通过大数据进行用户行为的分析,互联网企业的起步普遍更早一些。“5年前我们就建立了大数据分析平台。在这个平台上,可以将结构化数据和非结构化数据结合在一起,通过分析促进eBay的业务创新和利润增长。” eBay分析平台高级总监Oliver Ratzesberger说。

现在,eBay的分析平台每天处理的数据量高达100PB,超过了纳斯达克交易所每天的数据处理量。为了准确分析用户的购物行为,eBay定义了超过500种类型的数据,对顾客的行为进行跟踪分析。

在早期,eBay网页上的每一个功能的更改,通常由对该功能非常了解的产品经理决定,判断的依据主要是产品经理的个人经验。而通过对用户行为数据的分析,网页上任何功能的修改都交由用户去决定。“每当有一个不错的创意或者点子,我们都会在网站上选定一定范围的用户进行测试。通过对这些用户的行为分析,来看这个创意是否带来了预期的效果。” Oliver Ratzesberger说。

更显著的变化反应在广告费上。eBay对互联网广告的投入一直很大,通过购买一些网页搜索的关键字,将潜在客户引入eBay网站。为了对这些关键字广告的投入产出进行衡量,eBay建立了一个完全封闭式的优化系统。通过这个系统,可以精确计算出每一个关键字为eBay带来的投资回报。通过对广告投放的优化,自 2007 年以来,eBay 产品销售的广告费降低了99%,顶级卖家占总销售额的百分比却上升至32%。

掘金大数据

沃尔玛、eBay等领先企业在大数据方面的获益,毫无疑问起到了示范作用。IBM不久前发布的“全球CIO调查之CIO重要启示”指出,已经有83%的CIO拥有涵盖商业智能和分析的远期计划,并且CIO们开始更多地关注数据,而非应用。ITValue社区的调研结果也显示,57%的中国CIO对数据的关注程度超过应用。

凡此种种对于大数据的普及,确实是利好。一方面,商业智能的普及,让企业对数据的重要性已经有了充分认识;另一方面,社交媒体、电子商务、物联网等新应用的兴起,打破了企业原有价值链的围墙,仅对原有价值链各个环节的数据进行分析,已经不能满足需求。他们需要借助大数据战略打破数据边界,了解更为全面的运营及运营环境的全景图。

既然大数据关乎企业智商,那么,驾驭大数据的能力也自然成为企业的核心能力。这种能力将帮助企业寻找最优的模式支持商业决策,并确保做出接近于最优的商业决策。

但是,驾驭大数据的能力并不那么容易获得。虽然获取社交媒体、电子商务、物联网等新应用中的数据并不困难,但是传统的商业智能系统与分析软件,面对以视频、图片、文字等非结构化数据为主的大数据时,往往束手无策,缺少有效的分析工具和方法。这也为大数据的供应商们找到了更为广阔的利润增长点。

Teradata 公司2011年第1季度的营收比2010年同期增长了18%。在该公司总裁兼首席执行官Mike Koehler看来,大数据需求市场的强劲表现,是营收增长的重要原来,“许多公司面临着从持续呈几何级数增长的数据中管理以及萃取数据价值的挑战。此外,网络互动、社交媒体、移动计算和传感器等来源产生的新数据元素,提供了企业利用分析推动创新和赢得竞争的新机遇。这对数据仓库的扩展性和管理复杂性提出了前所未见的极高要求,而这正是我们的擅长之处。”

为了增强在大数据分析领域的优势, Teradata还收购Aster Data公司,以增强其非传统数据分析的能力,突破了SQL分析的限制,协助企业从全部数据中获取更多价值。

EMC是另一家将大数据作为重要发展战略的IT公司。2011年EMC World上,大数据和云计算成为EMC提及频率最高的词汇。EMC希望借助在大数据和云计算两个方向的耕耘,重新定位这家传统存储厂商的未来战略。

IBM在大数据领域的优势,相比于Teradata和EMC则更为全面。IBM在硬件与软件方面的优势,在大数据解决方案上得到了延续——IBM希望提供端到端、整体的大数据解决方案。而机器人“沃森”在人机大战中获胜,更成为IBM为其大数据分析解决方案加分的例证。

此外,HP、Oracle等公司在大数据领域也有着明显的优势。从目前的态势来看,由于大数据的技术门槛较高,在大数据领域展开竞争的IT公司,大都仍然是在数据存储、分析等领域有着传统优势的厂商。

同时,随着企业客户越来越看中供应商的整体解决方案交付能力,大数据又是涉及数据的获取、存储、分析等众多技术与应用的集合。随着大数据需求的不断爆发,将加速各大IT公司在这一领域的收购步伐,一些提供单一技术方案的IT公司,很可能难逃被收购的命运。(本文来源:商业价值 作者:吴以四)
 

责编:杨雪姣
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map