你给“大数据”贴上什么样的价格标签?“大数据”价值究竟几何?美国医疗保险行业每年潜在的价值是3000亿美元,零售商每年的营业毛利能增长60%,对于发达的欧洲经济体,由于每年运营效率的改善,能够节省1490亿美元,然而,这些仅仅是一个开始。
上面提到的这些例子,都是引自最近的一份麦肯锡全球研究院的报告,虽然看上去有些夸张,但是这的的确确是大数据分析潜在的价值。进行海量数据挖掘的企业在进行分析的时候,传统数据仓库和商业智能工具应对已经力不从心,大数据分析技术和方法被证明对提升业务洞察力非常有帮助。
尽管传统基于事实的BI分析模型也能够为企业带来价值,但是大数据分析为企业从多种数据源中挖掘分析铺平了道路,找出对未来企业战略具有影响的位置因素,能够大大提升效率并降低成本。
Enterprise Management Associates咨询公司的研究副总裁Shawn Rogers表示:“当你去审视多种不一样的数据中蕴含的新机遇时,高级分析技术将会派上用场。你要寻找的是一种工具,它能够帮助企业创建基于语义的数据模型和算法。”
某种意义上,Rogers提到的工具就是预测分析。与传统基于事务的数据仓库系统不同,大数据分析不仅仅关注结构化的历史数据,它们更倾向去对Web、社交网络、RFID传感器等非结构化海量数据进行分析。
从微博等社交媒体中挖掘实时数据,再将它们同实际销售信息进行整合,能够为企业提供真正意义上的智能,帮助他们了解市场发展趋势、理解客户的消费行为并为将来制定更加有针对性的策略。与此同时,利用RFID标签来追踪产品销量信息,能够让企业更好地管理库存,优化产品线并分析销售峰值周期。捕获并评估每一条非结构化数据的细节,能够防患于未然,对于企业提升其服务质量有着积极的作用。
两全其美
尽管大数据分析在互联网时代有着重要的意义,但是企业也应该认识到相应的挑战。大数据分析缺乏成熟的实践经验,其方式方法与传统的数据仓库与BI系统有着一定的区别。在实施大数据分析项目之前,企业不仅应该知道使用何种技术,还应该知道在什么时候、什么地方使用。
在混合的应用场景中,企业还将继续使用传统BI工具让业务人员进行即席查询和报表,这对于大数据分析环境是一个有效地补充。然后高级的分析用来应对非结构化数据,有些公司还会有科学家这样的职位,他们是高级或者资深的IT工程师,并且负责构建复杂的预测模型。举例来说,一个分析沙箱可能会归档3-4年的原始信息,这些信息是构建模型和模式匹配的基础。
针对不同场景构建不同的模型,这并不一定会造成信息孤岛。像Hadoop这样的开源分布式文件系统都是经常用到的。Gartner分析师Marcus Collins说:“Hadoop不仅仅是分析工具,还是非常好的ETL工具。很好的例子就是Twitter,企业利用Hadoop模型对数据进行分类,将聚合结果再送入数据仓库中做进一步的分析。”
有时候,企业在合理分配两种分析方式之后,对传统的数据仓库也会有一个更加深刻的认识。这才是商业智能最终要带给我们的应该是对历史数据的分析与对未来趋势的预测。
责编:亢晋芳
微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友