大数据时代我们同样需要反“大数据”公司

来源:机房360  
2013/3/7 9:58:59
在去年创办的所有初创公司之中,Fuzz肯定是最有诱惑力但却被大多数人忽视的一家公司。Fuzz自称是一个“完全没有机器人因素的人力电台”,人们在发现新音乐方面越来越信任各种算法,Fuzz对这一趋势提出了挑战。

本文关键字: 存储 大数据

在去年创办的所有初创公司之中,Fuzz肯定是最有诱惑力但却被大多数人忽视的一家公司。Fuzz自称是一个“完全没有机器人因素的人力电台”,人们在发现新音乐方面越来越信任各种算法,Fuzz对这一趋势提出了挑战。 Fuzz盛赞人工DJ发挥出来的重要作用,这里所说的人工DJ指的是Fuzz的一批固定用户,他们应邀将自己的音乐上传到Fuzz网站,以创建和共享他们自己的无线电台。

Fuzz背后的想法或者说希望是,人工DJ可以传递出算法所不能传递的信息。它希望朝着与Pandora相反的方向发展,而后者主要是通过各种算法来完成所有繁重的工作。Fuzz的创始人杰夫亚苏达(Jeff Yasuda)去年9月在接受彭博社采访时称:“用户对这种助理型体验有着巨大的需求,我们只是想让大家相信,最令人信服的推荐只能来源于活生生的人。”

但是,虽然Fuzz的上线几乎没有引起任何人的关注,但是各种算法在艺术加工过程中所发挥出来的重要作用却变得越来越不容忽视了。最近,《沙龙》的技术批评家安德鲁莱昂纳德(Andrew Leonard)在他撰写的一篇关于Netflix进军原创节目的服务――House of Cards的评论文章中也强调了算法的重要作用。 那些节目的原创性背后的秘密现在已经人人皆知了,即Netflix首先通过研究用户日志,发现重新制作一部同名的英国电视剧可能会大获成功,尤其是让凯文斯佩西(Kevin Spacey)来出演并由大卫费恩切尔(David Fincher)来执导这部重新制作的电视剧。

莱昂纳德提出:“在这个计算机算法已经成为最终的关注点的时代,这位著名导演还能继续生存吗?”Netflix搜集了大量的用户数据,比如用户在观看某些电视剧的第一季节目时点击了多少次暂停按钮等等,他想弄清楚Netflix搜集的这些数据会对未来的电视剧造成什么样的影响。

很多其他的行业也面临着类似的问题。例如,亚马逊通过其Kindle电子书阅读器搜集了关于用户的阅读习惯的大量信息,包括用户们看完了哪些书?没看完哪些书?他们一般倾向于跳过哪些章节?哪些章节看得最为仔细?他们一般多长时间会去查一次字典以及在某些段落下面划上下划线? (其实并非只有亚马逊一家公司在这样做,其他的电子书阅读器也在搜集类似的数据。)

利用搜集到的这些数据,亚马逊就可以预测出能够让读者一口气读完一本书所需的所有元素。也许亚马逊甚至可以为读者提供其他的结局,能够令读者更欣喜的结局。 正如最新发布的一份关于娱乐行业未来发展趋势的研究报告指出,我们现在所处的这个世界,很多事物都可以自行调整算法,以便建立一个更有魅力和互动性的未来。

获得了所有的用户数据后,Netflix再不进入电影制作行业就太愚蠢了。正如Netflix一样,亚马逊也发现了这一点,因此它必须进入出版行业。然而,亚马逊的认识其实比Netflix还要深,因为它还经营着一个售书网站,它知道消费者所有的购买行为以及消费者愿意支付的价格是多少。 现在,亚马逊经营着6种电子刊物,而且它还打算增加更多的刊物。

音乐行业在几年前就接受了类似的方法,搜集并建立了关于以前的热门歌曲和失败歌曲的庞大数据库,并借此来预测新歌曲是否可能成为热门歌曲。这种做法的优势是很明显的:新艺人无需拥有庞大的人脉关系也能与唱片公司签约,而在以前,人脉关系却是新艺人获得成功的必要条件之一。 现在,新艺人只需利用过去的成功数据演绎出一首新歌,就很可能成为一首热门歌曲。

但是这种做法的劣势也很明显:我们最终能够听到的新歌可能听起来都差不多,缺乏创意和活力。正如克里斯托夫斯泰因(Christopher Steiner)在他的新书《将此自动化》(Automate This)中所说:“这样的技术也许会给我们带来新的艺人,但是由于他们的判断完全建立于过去的流行歌曲基础之上,因此我们听到的新歌可能与我们已经忘记的那些流行小调都是同一类型的快餐作品。 这显然是这种技术的弱点。”

IBM开发出来的沃森超级计算机将被用于处理成千上万的法律和医疗文件,以便为人们做出各种决策时提供支持。由于需要阅读的文件太多,没有任何一位律师或是学会会员能够看完它们。 如果目标只是分析过去出售过的商品并以此来预测未来可能畅销的商品,沃森很容易被推广应用到音乐、电影和书籍领域。

然而,虽然这么做有利于提高销售业绩,但也有可能扼杀了文化的创新。沃森怎么可能预测出印象主义绘画、未来派诗歌或新浪潮电影的兴起呢? 它怎么可能赞同斯特拉温斯基(Stravinsky)呢? 而大数据也很可能会错过达达主义。

想要了解算法给艺术创作造成的限制和提供的机会,我们就需要了解算法提供的机会通常是由3个要素组成,即发现、生产和推荐。象Fuzz那样的初创公司瞄准的是第三个元素即推荐,它寄望于某些用户希望由活生生的人而不是算法来为自己提供向导。

为喜爱读书的读者提供图书推荐服务的FiveBooks也实行了一种类似于Fuzz的模式,原因是它认为活生生的人在推荐图书方面会比死板的算法做得更好。亚马逊在图书推荐方面已经做得很不错了,但是FiveBooks以一种不同的衡量标准向读者推荐了保罗克库格曼(Paul Krugman)、哈罗德布鲁姆(Harold Bloom)和伊恩麦克伊万(Ian McEwan)等作家的作品。 其实在推荐方面,人工推荐和算法推荐是可以同时存在的,至少在可预见的未来是这样,因为读者们会在这两种推荐模式中找到一个平衡点。

但是在发现新人才和研究未来的创作方向时,算法的效果就没有这么乐观了。毕竟,只有确实存在伟大的作品时,算法推荐才有意义。 如果算法选出的作品是建立在之前已经取得成功的作品和读者的及时反馈的基础之上,那么新作品的销量或许能够增加,但绝对不会为这个行业提供更有价值的好处。

最开始的迹象并不令人鼓舞。去年12月,英文版《环球时报》刊登了一篇关于本地朋克乐队熊战士(Bear Warrior)的报道,该乐队发现了一种巧妙的方法,能够检测出听众对他们的歌曲的反应。 乐队主唱是北京大学精密仪器专业的一名研究生,他设计了一台名为“POGO温度计”的设备,可以通过安装在音乐厅地毯中的一系列感应器检测出听众舞步的强度,然后将信号发送到一台中央计算机,最后让中央计算机对信号进行分析研究,帮助乐队改进他们的演绎方式。

据《环球时报》称,乐队发现,歌迷们会在鼓点敲响时开始摆动身体,而当主唱唱到歌曲的高音部分时,歌迷们跳舞的热情会达到顶点。 正如乐队主唱所说:“这些数据可以帮助我们了解到我们还可以如何去改善我们的演绎方式,让听众对我们的音乐作品作出我们希望看到的回应。”

或许,这确实有助于改善他们的演绎方式,但是朋克音乐什么时候变得这样细致入微了? 让听众高兴是管理顾问需要考虑的事情,但绝不是朋克音乐人应该考虑甚至着迷的事情!Sex Pistols乐队唱歌时,音乐厅的地毯只有一个功能,那就是供歌迷们在上面跳舞,绝不会安装什么感应器。但是乐队却创造了朋克音乐的一场革命,而熊战士乐队,顶多只能将朋克音乐变成他们谋生的职业。

责编:赵龙
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map