大数据做不了的事:计算机和分析的局限

来源: kaiyun体育官方人口作者:周雅 编译
2013/3/28 15:11:30
kaiyun体育官方人口 :专栏作家David Brooks指出了计算机的局限。他认为,数据需要方向,举例来说,如果没有人提供现实的背景或价值观来进行指导,数据本身是无法区分病毒基因和一个有价值的文学巨著之间的重要性差异。

分享到: 新浪微博 腾讯微博

kaiyun体育官方人口 报道,大数据与软件息息相关——但凡是软件,均有其自身的局限。在最近的纽约时报中,专栏作家David Brooks的《数据做不了的事》一文指出了计算机的局限。他认为,数据需要方向,举例来说,如果没有人提供现实的背景或价值观来进行指导,数据本身是无法区分病毒基因和一个有价值的文学巨著之间的重要性差异。

在这些局限中,有些是机器机能方面的,与人所固有的人文价值譬如直觉、社会背景和创意正好相反。举例来说,一台电脑无法明白你对那些每年见面两次的发小的付出,又或者是理解社会环境。人类具有讲故事的能力,能够将多种多样的原因和具体环境联系起来,从而更好地获取视角和方向。

更多的局限包括各种物理障碍,比如知识产权,又或者仅仅是挖掘和存储大量数据的物理行为太过无趣。《经济学家(The Economist)》最近的一篇文章《定义不明的大数据:是又不是》就对定义大数据及其资产价值的问题进行了讨论。它指出,版权法意味着这些称作“元数据挖掘”的研究需要研究者支付其对每篇文章的访问,就好像是处于19世纪用人眼对着书读一样。由此可以看出,获取数据的合法性也是另一个大的障碍。

关于局限所涉及范围的另一个明显的例子是,谷歌被指责利用其本该只拍摄周围全景照片的街景车窃取个人Wi-Fi数据。谷歌因此面临法律后果,特别是在欧洲,它已经在法国被判处罚款。尽管谷歌后来成功地对其行为进行了合法性辩护并维护了声誉,但仍有许多伦理问题需要慎重考虑。

拥有太少的数据会导致某些特定值被排除在外,并因此产生不确定性和误导性。另一方面,拥有大多的数据则会使结果变得混乱和模糊。正如David Brooks在他的文章中所说,“草堆正变得越来越高,然而我们所要寻找的那根针却仍埋在深处。”因此,从根本上说,虽然大数据(以及各种有用的数据)能够产生出色的预测,它仍有许多地方值得怀疑和深究。由于人类需求的复杂性,创意、伦理、见解以及社会背景仍是将我们与计算机区分开来的地方。

责编:刘沙
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map