数据让BI和预测分析如虎添翼

来源: 网界网作者:邹铮编译
2012/10/30 9:32:37
我们都知道,预测分析一直是“象牙塔里”统计学家和数据科学家的“特权”,他们远离日常业务决策者。大数据将改变这种状况。

分享到: 新浪微博 腾讯微博
本文关键字: 大数据 BI 社交媒体

我们都知道,预测分析一直是“象牙塔里”统计学家和数据科学家的“特权”,他们远离日常业务决策者。大数据将改变这种状况。

随着越来越多的数据流被放到网上,并整合到现有的BICRMERP和其他关键业务系统,预测分析最终将成为关注的焦点。虽然大多数客户服务代表和现场销售代表还没有感受到这种影响,IBM和MicroStrategy等公司已经开始行动。

大数据:预测分析不再是统计学家的特权

想象一下这样的世界,客户服务代表可以独立决定一个问题客户是否值得保留或者升级,又或者,销售人员可以基于人们对零售商在Facebook或Twitter上的评价来调整零售商的产品量。

大数据将组群分析和回归分析等较常用的工具交到日常管理人员手中,然后他们可以使用非交易数据来做出战略性的长期的业务决定。

然后,大数据并不是要取代传统BI工具,Gartner研究公司的BI分析师Rita Sallam表示,大数据将让BI更有价值和更有利于业务发展,“我们总是会需要看看过去的数据,当你拥有大数据时,你更应该这样做。BI并不会消失,它通过大数据被加强了。”

你如何知道在发现初始阶段看到的预测会随着时间的推移而得到证明呢,例如,在中西部地区,红色钱包真的卖得比蓝色钱包好吗?初步数据分析可能会这样建议,因为上一季度(甚至更早期)红色钱包卖得更多,所以红色钱包卖得更好。

但是这具有相关性,并不存在因果关系。如果你更加仔细地查看---使用从BI工具收集到的历史交易数据,你会发现,实际上是因为最新商家定位活动造成了这样的结果,因为商家将目光都放在红色钱包上。

这也是为什么IBM公司的新兴技术主管David Barnes更倾向于参考来自大数据技术(例如Hadoop、map/reduce等)的结果。例如,你不会想基于对Twitter流的情感分析来作出关键业务决策。

分析社交媒体中的非结构数据能够获得直接回报

社交媒体存在很大的商机。例如,作为零售商,你发现Justin Bieber的分析非常喜欢他在昨晚演唱会穿的外套,并且有人在Twitter上表示他从你的商店买到了一件,然后你可以快速决定增加那件外套的存货量,因为你知道这件衣服将非常热门,但只是在非常有限的时间内。

如果没有预测分析(PA),你很可能错过这个机会。

“在过去,我们会根据历史数据来做决定,但现在时代不同了,”Barnes表示,“现在我们需要预测分析。”

我们需要结合开源技术(大多数大数据平台都源自开源)、摩尔定律、商品硬件、云计算以及捕捉和存储大量非交易数据的能力来实现预测目的。

通常被认为是大数据背后的驱动力的非结构化数据(例如视频和电子邮件)几乎没有参与这一过程。你可以刷博客和用户论坛,然后将这些信息与地理数据相关联,并结合现有结构化客户数据,和来自Micro Strategy Wisdom引擎(追踪1400万Facebook用户对你的品牌的评价)等新来源的信息,这样你就获得了强大的预测能力。

BI供应商MicroStrategy公司的行业营销主管P.K.Paleru表示,大数据已经发生了两件事情,“你可能给结合不同来源的各种类型的数据,你还可以对所有这些数据进行微优化。”

缩短大数据分析时间

信息管理和分析咨询公司New Vantage Partners公司的创始人兼管理合伙人Paul Barth表示,这种分析的一个很大优势在于缩短“回答时间”(TTA),数据科学家曾经需要花几个月时间来建立查询或者模型以回答关于供应链或生产计划的前瞻性业务问题,现在只需要几个小时就可以完成。

这是因为大数据技术允许信息在被优化或者关系化之前进行分析。再加上高级分析技术,让业务经理在非常短的时间内询问和回答问题,不过,现在仍然需要IT员工和数据建模人员伸出援助之手。

“这些人正在使用大数据来自动化机器学习等过程,”Barth表示,这样做可以为每个产品线、每个市场产生20000个数据模型,让用户可以预测未来18个月。“这是一个很大的变化,他们之所以能这样做是因为大数据技术可以自动化很多建模步骤,并可以在无人职守的情况下执行。”

在不久前,这几乎是不可能的,统计分析师需要数周甚至数月来建立单个模型。如果你销售100个产品,你的整个产品线不可能超过1000个模型,这意味着这些模型返回的信息并不是很准确。

大数据分析的黄金时期还未到来

虽然这一切让业务用户感到激动,但是大范围普及大数据分析技术并不会那么快发生。Hadoop虽然很强大,仍然只是用于处理海量数据集的“原始”工具。

仔细考虑一下这些预测分析结果的实用性,1亿个人的意见真正超过10万人的意见吗?

“存在大量的重复的数据,”Barth表示,如果你想要正确地进行分析,“你仍然需要聪明的分析师”,幸运的是,大数据为他们提供了非常强大的工具。

责编:毋小艺
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map