大数据:商业革命与科学革命

来源: 中云网
2013/12/11 8:55:52
大数据与其他相关产业一起,带来的不仅是商业、科学和眼见即所得的类似智慧城市等的变化,还会带给我们对于生命本质是什么、存在的本质是什么等本体论的思考。

分享到: 新浪微博 腾讯微博

那么大数据能有哪些实际作用呢?我们最近做了一个研究,如果你在互联网上看了你认为很烂的片子,比如“富春山居图”,那么你在下一次评分时实际上倾向于打更低的评分,而不是倾向于打高分;这和很多人的感觉不一样——我看到了烂片,可能下次要打高分。这说明人们的行为有一种“锚定效应”。同样地,你看了一个好片,你下一次会倾向于打更高的分。当把这种“锚定效应”剔除后,就可以大幅度提高个性化推荐的准确度。这说明利用大量的数据分析可以直接解决一些实际问题。

然而,科学是一把双刃剑,大数据带给我们可能的福泽的同时,也带给我们可能的危险。

我举两个例子。第一个是今年发表在Scientific Reports上的一篇文章,它分析了200多万个手机的数据。手机数据的分辨率是比较低的,每一个小时有一个读数,告诉你这个手机的用户属于哪个基站。但实际上,在3个月的时间段中,只要有随机的4次让我们知道在某个小时中你处于某个基站,那么我就可以在200多万人中几乎可以唯一地确定你是谁。这对人的隐私是一个很大的侵犯,因为我们能够比较容易地通过科研和项目合作的方式拿到匿名的电信数据。在座的各位嘉宾都是有很大影响力的人,很多人可能想知道你们的手机,想知道你们去过哪些地方。他们只要在新闻中看一下你在什么时间、什么地点、参加了什么会议,如果恰好你在这期间的前后一两个小时没有关机,通过分析很容易找出你们的手机号码,进而知道你以前去过哪些地方,和哪些人有过联系。

下面介绍一个更典型的例子,是今年剑桥大学和微软研究院在《美国科学院院刊》上发表的一篇文章。研究人员分析了5万多用户在Facebook上点击“喜欢”和“不喜欢”的数据,这些数据可以用来预测你有没有酗酒、属于什么人种,它甚至还可以预测你是不是同性恋。这个案例背后潜藏的一个理论是,对于一个人来说,不同类型的数据,包括你的购物数据、说话内容、社交数据、喜欢和不喜欢的数据、看电影的数据等等,都从不同的侧面暴露了你这个人。基于每一组数据,都可以给你描绘一幅画像,每幅画像都和你本人有所区别,但是其间重复很多。从某种意义上讲,有了上述不同的数据,都可以对你进行预测与判断。

大数据伦理

大数据带来的不仅仅是商业和科学上的变化,更重要的是它带给我们很多观念形态的变化,引发我们重新思考很多问题。并且大数据一旦和很多其它重大的产业创新结合在一起,会产生尤其可怕的结果。举个例子,3D打印除了打印呈现技术和软件设计建模以外,很重要的就是大数据,因为它需要3D的扫描数据。3D打印有两种可在伦理上需要关注的发展趋势:第一个趋势是自己打印自己。随着技术的发展,这种3D打印机可以自己去找一些打印材料,利用太阳能或者其它能量熔化这些材料来打印自己。这样的3D打印机,它的硬件和软件都是开源的,未来可能会有一些人在这些开源硬件、软件中加入一些自己的代码。这些代码是对环境的某种反应,有些代码可能很善良、友好,有些代码可能很不友好,甚至具有攻击性。这些3D打印机的代码可以自己变异、学习,就象遗传算法一样:很多在不同环境变量下产生不同反应的模块通过某一种协议来交互,有的模块成功了,可能中间还有一些变异的机制,它就能复制更多的打印机;有的模块失败了,它的基因传不下去,它复制的打印机就变少了。如果有以二氧化硅为主要原材料的3D打印机出来,我们会问一个问题,这是不是某种形式的生命?它也可以繁殖、进化、变异,它可以活动、交流,甚至它可以攻击人类或者其它生物,那么它未来会怎么发展?

另外一个让人感觉到可怕的趋势是打印生命。现在,我们可以用喷墨打印机打印单细胞,耳朵已经可以移植成功了。以前肾脏只能在实验室外存活一个月,主要是它的血管系统做不好,而最近血管系统打印的难题也攻克了,所以单器官的移植就变得可能了。我们知道,如果要建立一个大厦,用灰尘建立是不可能的;同样的道理,要建立一个生命,用基本粒子是绝对不可能建立的。但是,像用砖头建立大厦一样,用细胞建立一个生命体是可能的。在十几年、二十年的时间里,我相信低等生命的打印机是可以成为现实的。未来有没有可能打印高等生物,甚至打印人类呢?打印人不同于克隆人,如果卡尔。马克思的理念是正确的,那么打印人拥有和我们完全相同的记忆,包括我们深刻的痛苦、感情经历、幸福快乐等等。这样的打印会带来什么样的伦理冲击呢?

我相信,大数据与其他相关产业一起,带来的不仅是商业、科学和眼见即所得的类似智慧城市等的变化,还会带给我们对于生命本质是什么、存在的本质是什么等本体论的思考。希望我们都能成为一个新时代来临前第一批做好了充分准备的人。

共4页: [1] [2] [3]4 下一页
责编:王雅京
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map