大数据会走向何方?

来源: kaiyun体育官方人口作者:赵龙
2012/7/20 9:13:12
kaiyun体育官方人口 :大数据很热,但推行之前势必要对其进行了解。现在没人清楚大数据究竟怎样带来甚至能否为企业带来价值,下面就让我们揭秘大数据的要点。大数据对企业业务所蕴含的潜在商业价值对技术开发人员来说是显而易见的,而现实是许多问题阻碍了大数据技术的发展和实际应用。

分享到: 新浪微博 腾讯微博

大数据很热,但推行之前势必要对其进行了解。现在没人清楚大数据究竟怎样带来甚至能否为企业带来价值,下面就让我们揭秘大数据的要点。

大数据对企业业务所蕴含的潜在商业价值对技术开发人员来说是显而易见的,而现实是许多问题阻碍了大数据技术的发展和实际应用。

大数据是否有价值,如果有,在哪?

且先让我们看两个大数据实际应用的案例:

① 沃尔玛是最早通过利用大数据而受益的企业之一,曾拥有世界上最大的数据仓库系统。通过对消费者的购物行为等非结构化数据进行分析,沃尔玛成为最了解顾客购物习惯的零售商,并创造了“啤酒与尿布”的经典商业案例。早在2007年,沃尔玛就建立了一个超大的数据中心,其存储能力高达4Pb以上。《经济学人》在2010年的一篇报道中指出,沃尔玛的数据量已经是美国国会图书馆的167倍。

② 3月11日日本大地震发生后仅9分钟,美国国家海洋和大气管理局(NOAA)就发布了详细的海啸预警。随即,NOAA通过对海洋传感器获得的实时数据进行计算机模拟,制作的海啸影响模型出现在YouTube等网站。

例①的“啤酒与尿布”已成为营销管理的经典案例,通过发现消费者在购买‘啤酒’时通常会捎带购买‘尿布’的行为,来达到刺激销售的目的。

例②让我们有理由相信,“大数据”技术让我们在面对不可抗拒、预知的自然力量时候,能够最大程度的保护自己,避免经济损失。

谁会用到大数据?

大数据与普通数据有两个明显区别,一是海量,二是响应速度。“大数据利用传统工具往往需要数月时间才能完成分析,而应用大数据工具后,不到1s时间就可以获取同样结果。”

大数据的应用不仅仅停留在IT领域,在医药、科学、制造以及气象等行业,都出现海量的数据应用,如果能合理的利用这些资源,对行业将带来巨大的推动,但目前来看,大数据应用尚不广泛。

广告投放者

“我的广告费有一半被浪费了,但问题是我不知道是哪一半。”

“我们放一个路牌广告,我能告诉你西单路口一天两千万人可以看见,这个数据如何得出?有人专门在那里去做调查?肯定不是。”

现在,想了解用户的互联网行为,调查问卷、采样这些手段已经不需要,所有的数据都能通过浏览器等终端主动收集,而后的分析结果,不再是针对若干样本,而是完整的目标群体。这就是“全数据”。

这意味着什么?广告投放者不再依赖基于某个随机样本容量所反映出的用户行为进行决策,他们能掌握所有查找、点击、购买过自己产品的用户们的互联网行为数据!参考这些数据,进而做出通盘考虑后的决定。在数据收集合理完整的情况下,他们甚至有可能计算出来自己每一分广告投入带来的回报。

互联网企业

去年,大数据分析主要还是应用于一些大型Web企业,像Yahoo或者Facebook,它们需要分析点击流数据。到了现在,“大数据分析已经不再局限于Web的范畴,有大量数据生成的企业数据掘金都有可能用到。”例如银行、公共事业部门、情报机构等都在搭乘大数据这辆车。

事实上,大数据技术已经被一部分比较前卫的公司有选择的应用了,比如受社交媒体推动而需要创建相应Web服务的企业。它们对于大数据项目的贡献非常重要。

而在其他垂直行业中,有些企业正在意识到,它们基于信息服务的价值定位要比它们先前想象的要大得多,所以大数据技术很快就吸引了这些企业的注意。再加上硬件和软件成本的下降,这些企业发现它们已经处在了一场企业大转型机遇的完美风暴中。

大数据面临的挑战

大数据应用广泛应用之前,还有一些不得不解决的难题

●数据量:由无数移动终端、社交网络生成的越来越多的业务数据对IT系统带来了更大的挑战,数据的存储和安全以及在未来访问和使用这些数据已成为难点。

●数据延迟:需考虑组织内部数据延迟的三个方面:数据发生时机、事件延续时间、决策所需时间。

●数据格式:大数据不仅量大并且格式繁多,不同的数据格式需要有针对的分析处理。从E-MAIL、数据日志和信贷记录,再到科学研究数据、医疗数据、财务数据以及庞大的的图片、视频等媒体数据。

●数据关联:与商业用户合作确定数据的前后关系,并就使用中的多个数据集建立相互联系,同时还需要考虑数据增长率以及重复的来源。

●自服务:确定高级用户如何在不影响IT或其他资源的情况下,对用于查询的数据实施控制。

●首席数据官(Chief Data Officer):指定一名高级职员担任首席数据官的职务,使其能够在维持组织治理的同时保证数据的可操作性。

大数据分析技术涵盖的5个方面

由于大数据的特殊性,大数据分析技术还处于发展阶段,老技术会日趋完善,新技术会更多出现。

1.可视化分析

数据可视化无论对于普通用户或是数据分析专家,都是最基本的功能。数据图像化可以让数据自己说话,让用户直观的感受到结果。

2.数据挖掘算法

图像化是将机器语言翻译给人看,而数据挖掘就是机器的母语。分割、集群、孤立点分析还有各种各样五花八门的算法让我们精炼数据,挖掘价值。这些算法一定要能够应付大数据的量,同时还具有很高的处理速度。

3.预测性分析能力

数据挖掘可以让分析师对数据承载信息更快更好地消化理解,进而提升判断的准确性,而预测性分析可以让分析师根据图像化分析和数据挖掘的结果做出一些前瞻性判断。

4.语义引擎

非结构化数据的多元化给数据分析带来新的挑战,我们需要一套工具系统的去分析,提炼数据。语义引擎需要设计到有足够的人工智能以足以从数据中主动地提取信息。

5.数据质量和数据管理

数据质量与管理是管理的最佳实践,透过标准化流程和机器对数据进行处理可以确保获得一个预设质量的分析结果。

小结:

随着大数据的持续升温,更多的企业开始利用Hadoop平台分析处理大数据,据今年Hadoop峰会数据显示,Hadoop服务提供商已从09年的9家增长至现在的120家。当然,仅仅只靠Hadoop服务无法彻底解决大数据问题,更多的数据库管理系统开始整合Hadoop服务,像HP,DELL,ORACLE,IBM等都有了自家特色的Hadoop服务。大数据技术的完善不仅有利于企业对数据的分析查询,还会在安全性上更上一层楼。况且,大数据分析还有其他优秀平台Datahero、Platfora。小编以为随着大数据分析技术人工智能自我学习功能的发展,大数据的广泛应用只是时间问题。

责编:赵龙
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map