大数据时代存储还是必须的吗?

来源: kaiyun体育官方人口作者:程浩译
2014/3/12 12:52:36
kaiyun体育官方人口 :关于大数据的讨论往往聚焦在将大量数据进行存储,然后再进行回顾式的分析。而存储又带来了新的问题,诸如数据如何存储、数据如何组织、怎样清洗数据以及怎样的时间划分是合适的。换一个思路,我们可以选择进行实时大数据分析。

分享到: 新浪微博 腾讯微博

关于大数据的讨论往往聚焦在将大量数据进行存储,然后再进行回顾式的分析。而存储又带来了新的问题,诸如数据如何存储、数据如何组织、怎样清洗数据以及怎样的时间划分是合适的。

尽管这些基于存储的问题解决了,分析师还要决定哪些数据是已经过期了的。它们可能已经过时了,不能够用来反映当前环境了,有些历史数据是不能给我们一个关于未来的视角的。

实时数据分析

换一个思路,我们可以选择进行实时大数据分析。这样的话,我们就不用考虑大规模存储相关的问题了,而改为关心商业数据流量带宽了。Jeff Bertolucci在Information Week上面写道,电信公司最早开始使用实时大数据分析来了解当前的网络状况。“先存储,后分析”的方法,在要求实时性的领域中作用可能就不大了。

尽管中小企业可能没有像电信公司那么大量的数据流,但是他们也应当在投资数据存储之前,先知道它们需要哪些商业数据。Mary Shacklett在Tech Republic上面的一篇文章中提到,清理历史数据,然后得出有用的结果的花费很可能已经超出中小企业的预算承受范围了。从过去中反思学习的确是好的,但是对于中小企业而言,这样的投资得到的数据分析质量的确还是存疑的。

实时分析的好处

IT专家应当推荐企业走向实时之路,而不要陷入无尽的数据清理之中。实时分析之中往往见效很快,中小企业短时间内就能看到数据分析的好处;而用传统方式大规模存储,企业要投入很多资金。实时分析方法还有一个好处,就是让中小企业能够了解到哪些商业数据是需要的,因为毕竟不是所有的数据流都要用到商业分析之中。

通过对数据流的检验,中小企业能够看出哪些是有必要进行存储并回顾的。数据可以在源头就得到了优化。

要知道,洞察力来自于对数据的了解,而不在于你存储了多少数据。

责编:刘沙
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map