有效管理大数据的主要策略

来源: 互联网
2013/6/5 19:04:52
据悉,Gartner最近的一份调查报告显示,企业数据年平均增长速度大约在40%到60%。而美国政府在即将到来的大数据项目中将面临重重挑战,其中之一就是生成数据量不足。一些生成大量数据机构(包括国家天气服务局、国家海洋和大气管理局)的主管政府部门,美国商务部的这一数字甚至更低。

分享到: 新浪微博 腾讯微博
本文关键字: 大数据

据悉,Gartner最近的一份调查报告显示,企业数据年平均增长速度大约在40%到60%。而美国政府在即将到来的大数据项目中将面临重重挑战,其中之一就是生成数据量不足。一些生成大量数据机构(包括国家天气服务局、国家海洋和大气管理局)的主管政府部门,美国商务部的这一数字甚至更低。

美国商务部CIOSimonSzykman在最近的FOSE大会上表示:“我们不存在挑战的领域之一就是我们生成数据的能力。我们生成数据的基本能力提升很大,从很大程度上讲,这一能力已超越了我们处理数据、管理数据和转移数据的能力。”

如何管理数据,并将数据从一点转移到另一点,将是美国政府面临的一大挑战。Szykman还提到了商务部在大数据中遇到的其他一些重要问题,主要为以下五个方面:

数据的真实性

大数据的重要性不仅是在于数据所生成的记录,更大的价值在于根据这些数据得出科研结果的“复制能力”。而从学术层面来看,这正是你证实所做工作价值的时候:其他人也可以对结果进行复制。另一方面,如果你丢失了得出科研结果的那些数据,这会降低结果的合理性。

数据工程师

研究领域的很多科学家正在研究大数据的精密使用,比如在预防医学、药品设计和胎儿检查领域如何开发基因数据。但Szykman担心的是,真正了都大数据技术构架的人太少。我们需要好好想想大数据及我们如何利用它,特别是在一些特殊领域。无论是政府的直接应用还是由政府出资科研,政府都在推动大数据这一前沿技术的发展。

大思路,早规划

在向开放数据转移的过程中,尽早搞清楚系统生命周期的要求显得越来越重要。在过去,没有做的一件事就是尽早研究开放数据在生命周期上的要求。数据模型、分享和信息的情况会越来越普遍,而系统性的战略会越来越多。在生命周期的早期,当我们成功安装新的系统或应用程序后,就应该尽早考虑该问题。

保密性vs.完整性

对于那些有科研基础的机构而言,大数据安全不仅仅是一个保密问题。数据的长期完整性也是企业更大的担忧。这是IT界一直为之努力的议题。有时候,我们过分关注结果而忽视了安全。人们有时会问:‘我们最终都要和公众分享这一数据,那安全有什么重要呢?’

这一问题的最佳答案来自科研机构,如NOAA。他们收集的基准数据正巧是美国气候变化政策备受争议所在。不管这些政策的政治倾向性如何,它们都对经济有重大影响。如果我们放弃了这些长期气候记录数据的安全性,那将造成严重后果。我们的确得好好想想大数据的问题。

制定基准线

由于很少存在类似的应用程序,难以获取相关信息或进行比照,因此有时候很难评定大数据以及其他高科技项目的开支和风险。出台开支和风险的基线,对大数据和数据中心来说都是一大挑战,因为还没有相关标准。操作一些简单事情有时候充满挑战,如计算数据中心的能耗。大数据基线不仅在基础设施层面,还包括数据包,都需要对未来资源进行更优规划。

责编:李红燕
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map