|
“沃森”来了:大数据原来可以这样玩儿试想一下,当我们对着计算机说上几句话,就能得出最想要的结果,比如“我们该在哪里开设下一家店?我去哪能买到最便宜的衬衫?这样的症状应该如何诊断?…”看上去这像是科幻电影中的桥段,但事实上这是大数据及分析所追求的一种终极目标。 “沃森”和“大数据” 自然语言理解、找到证据、判断,是沃森所具备的的三大能力,这种“认知计算”能力让沃森在当前的大数据浪潮中大有用武之地。 大数据已经被公认为是一座“金矿”,但如果从中无法提取“黄金”,大数据也毫无价值可言。大数据有着数量大、速度快、多样性、不确定性等特点,故而数据的采集、存储、管理和分析并不简单,如何将纷繁数据化繁为简,实现类似人脑的认知与判断,发现新的关联和模式,从而做出正确的决策,才是大数据分析的核心价值。 沃森的工作过程实际上是一个完整的大数据分析过程:识别理解自然语言是处理非结构化数据的过程,找到证据就是从不同来源的大数据中检索的过程,判断就是给证据评分,作出最佳决策的过程。好比我们在谷歌进行搜索,输入关键字中可能会出现数十万条结果,哪条结果是最合适自己的,需要自己来判断;沃森所做的就是充分理解我们的意图,帮助我们从海量的结果中挑出最合适的,它代替了人类进行分析决策的过程。 具备这些能力,沃森在大数据领域会有非常光明的前景,因为大量的行业的数据资料都是以自然语言编写的,比如医疗行业的医疗记录、文本、杂志和研究资料,这些都是计算机难以理解语言;在零售、旅游、金融、电信、服务等行业,同样存在着大量以自然语言存储和编写的资料,如果存在一套能够这些自然语言资料中快速找出准确答案的系统,将为行业带来巨大的改变。 据Ian Jarman先生介绍,沃森不再是电视节目中的明星,如今已经进入医疗、金融、呼叫中心行业提供支持服务。比如在医疗领域,沃森从不同的信息来源采集数据并且提炼,给医院,或者是医师、医生提供医疗采购方面的建议和咨询意见。在美国德克萨斯大学MD Anderson癌症中心,沃森已经在其中对医生提供建议,以助于治疗复杂的疾病和癌症。 沃森商用要过几道关 IBM将沃森作为面向大数据市场的重要工具,为了让沃森进入更多的行业,IBM近日宣布建立沃森生态系统,向合作伙伴提供技术、工具和API编程接口,希望借助云服务和访问工具,利用沃森帮助合作伙伴开发他们的认知计算软件及系统。首批合作伙伴包括零售业的Fluid、医疗保健领域的MD Buyline以及健康管理领域的Welltok。另外,IBM还建立了一个沃森内容库,供应商可以为沃森提供内容,包括通用和专用的信息,如医疗保健数据资料等。 寻找合作伙伴是IBM的习惯做法,也起到了很好的效果,例如在IBM Power Systems在中国实施的“天工计划”和“天合计划”,大大提升了Power服务器的市场覆盖面。 独木不成林,沃森要拓宽应用领域,也需要建立自己的生态圈。IBM更擅长的是硬件和大数据分析工具,想要将沃森应用于那些具有专业性的行业,例如医疗,就需要借助那些具有较深行业背景的合作伙伴的力量。同时,沃森能够得出正确答案的关键在于以丰富的证据来支持结果,这就需要广泛的信息来源,沃森内容库的建立更需要IBM和合作伙伴以及客户的通力合作。 那么,是不是意味着沃森的合作伙伴越多、生态环境越大,沃森越容易找到需要的结果和支持的证据?是不是IBM应当将沃森内容库向所有人开放,就像谷歌,让所有人都能够贡献数据资源?笔者认为这不是一个理想的状态,虽然沃森需要广泛的信息来源,但前提是这些信息应当是可信的,因为沃森要从中寻找证据来支持结果,所以信息来源的可信度是关键,一旦根据大量错误的证据得出错误的答案,后果是非常严重的。 这正是沃森和谷歌所不同的地方,谷歌虽然有大量的信息来源,但其中有可信的,也不乏大量的不可信信息,大量信息的检索也会增加系统的负载。笔者认为这也是目前IBM谨慎的选择沃森伙伴的原因。未来,沃森也许不会向公众公开信息来源的渠道,因为信息的甄选并不是件容易的事情。但是,用沃森来提供公共云服务是个不错的做法,公众可以更加快速准确的获得专业的建议和搜索结果,免去了自己筛选和判断的麻烦。 另外一个问题,沃森目前还仅限于理解英语语言,还没有多语言版本,也就是说,在繁杂的语言环境中沃森的自然语言理解优势也就不复存在了。例如在中国有着大量的方言和表述方法,即使对于一名中国人来说,很多语境理解起来也颇具困难。想想看,让一台机器去理解“倒鸭子”,仿佛是件匪夷所思的事情。不过支撑沃森的一些底层技术,如Power服务器、Symphony、InfoSphere等大数据分析平台和技术在中国都已经上市,假以时日,未来也许能理解“倒鸭子”的方言版沃森也会横空出世。 最后总结一下,沃森所代表的认知计算,为大数据的未来描绘了一幅美丽的图景,也将人工智能大大推进了一步。也许未来大数据应用就是那样简单,我们只需对着计算机、甚至是随身的终端设备说出我们的需求,就能快速得到最准确的答案。 责编:郑雄 微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友 著作权声明:kaiyun体育官方人口
文章著作权分属kaiyun体育官方人口
、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。 |
最新专题 推荐圈子 |
|