科学家助战人机大战:帮沃森理解人类语言

来源: http://server.51cto.com
2011/2/25 15:57:54
早在美国当地时间1月13日的练习赛中,IBM的超级电脑“沃森”已险胜美国最受欢迎智力问答节目《危险边缘》的两名冠军选手。IBM副总裁约翰·凯利说,IBM的中国大陆科学家 “做出了重要贡献”,他们帮助“沃森”处理人类的自然语言,并迅速对复杂问题作出回答,他们贡献了可以让“沃森”更快“思考”的软件,助战人类有史以来的第一次人机智力问答对决。



分享到: 新浪微博 腾讯微博
本文关键字: 人机大战 沃森

新闻视点:中国科学家的“重要贡献”具体指什么?

潘越:在该项目的IBM全球研究团队中,有多位来自IBM中国研究院的研究人员。我们负责为“沃森”系统采集、分析和使用各种结构化的知识。而美国研究院侧重于非结构化的知识,即形式相对不固定的类似百科全书的知识,范围虽然广,但有局限。我们则以范围虽小但信息更可靠的结构化知识,提供问题解答,排除让系统显得“愚蠢”的答案,以帮助“沃森”更准确地思考。当然,结构化知识的数据非常多,需要强大的万维网管理来提高解答速度,正好我们之前开发的引擎能够适用,从而帮助“沃森”更快地思考。如今,来自IBM中国研究院的很多技术成果已经融入在“沃森”系统中,有的研究成果则成为整个科研团队的借鉴和参考。同时,来自中国高校的优秀博士生,也参与到了这一挑战性问题的研究中。

“深蓝”与“沃森”哪个更“聪明”

10组Power 750服务器,运行linux操作系统,15TB(1TB=1024GB)内存,2880个处理器,每秒可进行80万亿次运算——这是体积为10个冰箱大小的超级电脑“沃森”的数据。比赛时,庞大的“沃森”甚至并不与选手在同一房间内,它的服务器要占据整整一个房间。约翰·凯利通俗地打了个比方,“沃森”所存储的信息,相当于2亿页图书,“就初始计算能力来说,‘沃森’的能力大约是‘深蓝’的1000倍。”

1997年5月,被誉为“世界上最聪明的人”的国际象棋大师卡斯帕罗夫,经过6局对抗后,败于“拥有超人的计算能力”的超级电脑“深蓝”,全球瞩目,被称作“里程碑式的人机博弈”。

新闻视点:有报道称,研究人员说“沃森”比“深蓝”更“聪明”。但“沃森”不就是存储了大量信息的搜索引擎吗?

潘越:“沃森”所要做的,比搜索引擎的工作多得多。按比赛规则,“沃森”每次只能提供一个答案,而搜索引擎只能给出一篇或多篇可能包含答案的文章列表,用户还需要花脑力去发现确切答案。那么可能有人会问,设计一种软件,从搜索引擎给出的排在第一位的文章里找出答案,不是也可以吗?关于这点,我们做过研究。按现有搜索引擎,准确度只能达到个位数,然而“沃森”的准确率约达85%。

还有一点很关键,“沃森”不仅要给出答案,而且必须是有把握的答案,不然反而失分。而一道线索的理解,往往有多种,比如10种理解,再比如根据每种理解产生10个答案,那么一道线索就会有100种答案,其中哪一种最有可能是正确的,就需要辅以各种各样的证据来看哪一种的支持率最高。也就是说,“沃森”的计算速度和资源消耗量,现有搜索引擎没有可比性。

新闻视点:美国当地时间1月13日的练习赛,是“沃森”的首次公开展示。此前它曾秘密与《危险边缘》的选手展开了多场比赛,战况如何?

潘越:胜多负少。

新闻视点:虽然“沃森”设计用于参加《危险边缘》,但这项技术的应用不止于此吧?

潘越:可以广泛应用于医疗、在线自助咨询等专业领域。比如老百姓得了什么病,可以通过它来循症判断,帮助筛选海量信息后准确诊断病情;比如游客到了一个陌生的城市,可以通过它来获取有效的城市公共信息服务。总之,这种技术将允许人类与机器更自由地交流,人们可直接向电脑提问,取代键盘输入后再查找、分析等。

人脑电脑孰优孰劣

练习赛中,“沃森”共获4400美元的奖金,相比之下,肯·詹宁斯与布拉德·鲁特尔分别拿到3400美元和1200美元。而日前某门户网站连续一个月的竞猜中,认为“沃森”获胜的票数,竟接近“人类选手获胜”的两倍。

电脑叫板人脑,自“深蓝”挫败卡斯帕罗夫后就屡被提及。“这是一部像人的机器,和一个像机器的人之间的决斗。”当时世界排名第二的棋手阿南德,曾如此评价这一瞩目战局。那时,猜测“人类制造的机器会将人打败”的人数不少。以至于2003年卡斯帕罗夫再次“人机大战”的一开局,就被定调为“要为人类争面子”。

从1997年至2003年,对阵的电脑已由1秒钟内能算出2亿个棋步,进步为112亿个棋步,“棋力”长了56倍。而且,它仍然拥有不受身体、心情和天气变化等影响的“心理素质”优势。但2003年那一役,“人机大战”四个回合后以平局告终。

事实上,所谓的“人机大战”,只是人类在挑战自己的智慧。或许正是这种不断挑战的压力,才使得人类的科技水平与人类社会的发展相互见长。因此,人脑电脑孰优孰劣,其实并不能算作一个问题。

从2009年冬天开始,IBM的科学家们已经开始模拟《危险边缘》的直播现场,测试“沃森”与真人对抗的能力。他们布置专门的比赛场地,聘请主持人,还请来该节目以往的参与者扮演对手。但当本报记者问潘越“沃森”在比赛中最大的挑战是什么?他的回答仍是“人类语言,比如双关语”。当美国网站记者问“沃森”项目主管埃里克·布朗,对最终胜出是否有信心时,布朗说:“我们充满信心,但表演赛只有两场比赛,一切皆有可能发生。”

尽管即将到来的《危险边缘》正式人机对决很可能惊心动魄,但今天的人们似乎已不必把比分看得那么重要。以IBM创始人托马斯·沃森的姓来命名的“沃森”,其背后蕴藏的商业价值,才是许多人真正关注的重点所在。如IBM的科学家坎贝尔所说,“制造解决其他问题的‘深蓝’,是研制‘深蓝’的最终目标”……

共2页: [1]2 下一页
责编:张欢
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
IT系统一体化时代来了

2009年Oracle 用Exadata服务器告诉企业,数据中心的IT服务一体化解决方案才是大势所趋,而当前企业对大数据处理的..

高性能计算——企业未来发展的必备..

“天河二号”问鼎最新全球超级计算机500强,更新的Linpack值让世界认识到了“中国速度”。但超算不能只停留于追求..

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map