|
知意图:了解大数据的意图
各位网友大家好,今天我们为大家请到的是来自精诚集团云中心和Big Data事业处的负责人蒋居裕先生,欢迎大家。
Etu为什么可以给他,是因为前面有这些半结构化大量的数据,所以这个是串起来的,可是另外一些例子是Etu平台做到就完了。比如我们做搜索,这个搜索可能是针对千万个或者上亿个的搜索,也有可能是针对一页的网页,但是你要把关键字找出来,这些不管是什么数据其实都是非结构化的数据。这个东西进入我们Etu平台里面我们可以对他进行索引,然后提供像百度或者谷歌那样关键字搜寻的网页,很简单。这个直接进行关键字查询之后结果就出来了,这是大家很关心的事情。可是这个里面我们可以不需要这个数据库,不需要些关键字的。 主持人:那所以这样的话我们Etu在推广的过程当中,可能会遇到不同的问题,这可能是结合企业的需求来讲的。比如说我的某些需求是需要这两个依存,这个可能就有一个前提。但假如你只是仅仅对一些图片或者视频这些的话,那我们是不是可以用分布式的这种?是不是可以这样界定? 蒋居裕:是的。 主持人:那您现在推进的一个过程当中,哪些企业的需求更强烈一些? 蒋居裕:实如我们所分析的,我们今年在整个市场上会挑一些重点产业,打一些重点应用来凸显这个价值,这些产业是什么?我们一开始锁定的像电信,这些运营商其实里面有很多很多的运营都可以用大数据的处理做。比如说刚刚提到的,它的使用的分群,找出ERP,找到对应的VIP该有的待遇。但就是说在找出VIP之前他也想知道到底用他的3G网络上网的使用者到底去了哪里,看了哪些内容。因为他能分析到这一点的话就可以做后续增值的服务。比如说推送广告。另外他们可能会希望做到或者电信设备的优化工作。这些东西不管是跟使用者相关,还是说为了保障使用者在网络里面有更高品质的网络服务。那这些东西其实都很直接很直接,作为运营商要有这些东西才有办法让他的客户满意度提高。 另外像在银行、保险,我刚才提到的大量图片的搜寻,他们内部也会这样。因为你想每一家保险公司后面都有成千上万的使用者,他们每一张保单的费用都会很多文件,这些文件都会扫描放到他的存储系统里去。可是今天他必须针对某一个保护,某一个事件发生的时候,要把相关的调阅出来的时候,如果没有中间这一层的索取功能的话会很痛苦。上亿个存档如果放到冷数据存在系统,应该先到处理搜寻的地方。可是如果直接放在我们Etu的话,直接就可以调用。刚才是提到电商,我们今年特别针对电商这个市场也做了一个出来。那你可能会说电商不就是互联网的一种企业嘛,没有错,可是它跟那些像百度、腾讯这一些他们自己已经用很多大数据处理得技术人来说,他们比较多还是偏重于他们的一部分。技术部分比较愿意采用外厂商提供给他们的。这是我们观察到的市场的所谓的细耕。 要做细耕的过程里面绝对会有需求说,透过千万会员跟浏览行为做出的推荐。这个也可以用人为的方式做推荐,因为人去输入说在这个数据库里面相关的数据,其实还是可以给你一个推荐表,可是这个推荐表准不准?不准。因为是为了促销某一个东西,但我们今天给他的是一个基于他的浏览行为产生的。这个就是非常系统化的工作了,这个工作里面没有什么介入的空间,因为人在非常大量的数据里面操控它,这件事情是做起来没有效率的事情。 所以当他有关联性,可以朝着这种机制,加上自动化大数据的机制,他就可以结合起来,提供给他最好的一种体验。 主持人:其实我们自己也能感受到,比如说某个电商,网上购物已经是很常规的操作行为的。我现在越来越多的发现,在不同的网站,推荐所有的东西,能够让我再去选择,推荐出来的东西能够让我有兴趣选一下。所以我觉得像您刚才说的其实对于营销本身来讲的话,其实这是很好的帮助,但是您刚才说的这些的话,我觉得对于很多企业来讲,都会是一个非常好的部分,其实我们现在去汇总一下,现在我们关注的这些行业恰恰也是非常关注的,对于客户的体验。所以在这些产业里面就是会更加能够先感知到的产业。当然,我觉得其实对各个产业来讲,因为我觉得任何一个做营销的公司,除非你真的是一个垄断,我不需要管理。您在这个过程当中谈到hadoop,这个词也是大家非常知道的,听了很多次了,我也听了很多次。但可能会有一些公司有这样的合作。具体是什么时候的合作? 蒋居裕:其实我们在谈Hadoop,所以在这个生态系里头还是美国走在最前面。根据我这两年,其实我都有持续参加美国相关的峰会。我所看到的情况就是这里面最主要有几个角色,一个是各个不同的发行版本。就类似于我们会有不同的发行商一样。可是也很多会把它包成他自己的版本,中间的核心是不会变的,可是会有一些相对的管理工具放在上面。我们一定要跟某一个发行版本上工作,我们不会去自己做这件事情。 再来的话就是有一些整合性的工具开发商,他开发的这个工具,他企图要做的是希望把这个大数据的使用权利从程序员手上解放到那一些做数据分析的人,以及一些商务的使用者身上。比如说我只会按Excel,那我们用Excel来存储放在你Etu上面的规划数据呢,这个目前已经是可行的,只是说没有相当的成熟。 所以,我们一个是发行商一个就是这种整合性的工具开发上。这是目前Etu在整个生态系里面就有合作的。再一个我们Etu的一体机,本身是为了服务层,其实除了我们自己之外我们还是希望有一些不同的行业里面还有价值开发能力的,就是程序的就可以直接拿去用,就不用自己面对那么复杂的集群,要去做部署的这件事情。所以另外一个方面来看,面对市场我们也要集结一批在这个平台上面开发应用能力的价值开发商,这个就是我们目前针对整个生态系统本身在做的一些不同的事情。 主持人:也就是说一体机我们提供的是这样的平台,接下来整个应用可能也会共同的提供一些价值?所以包含这两个方式? 蒋居裕:对。 主持人:是这样的,也是我们现在当下比较重要的模式,大家比较擅长的事情,大家可以互相借鉴。其实这个对于客户来讲其实也是一个更大价值的体现。我觉得最后一个问题我是比较感兴趣的,就是我们在谈大数据时间也不是很长,整个大数据的状态也有很多变化等等。我们如果看未来的话,它一直是在这个水上,那我们知道我们再往后看,在大数据整个分析领域,价值挖掘这个里面围绕大数据都有什么样的产业?包括像我们这样的产业,其他的产业接下来的发展方向会是什么? 蒋居裕:我觉得这个发展方向还是回到刚才我们所的现状,这个现状就是我们还没有跨越那个鸿沟,所以我们现在最重要的事情还是特定的行业里头,特定的应用做出来。把特定的商业价值贡献出来。这个是对于以hadoop为中心的生态系最重要的关键任务。如果这个关键任务不能达成的话,今天我们所做的这些努力可能就白费了。但是我们非作不可,因为第一个我们要认知,第二个我们这个专业,甚至刚才提到了有很多这种国际型的大厂都进来了,大数据的市场。但其实它有对应的产品跟技术人员,可是他在大中华地区却没有对应的技术支持人才,他会寻求跟我们合作可是他愿意在很多地方,在数据库、数据仓储那边获得更大的利益。在这样的情况底下其实就有很多的空间。 再一个他们都没有技术支持的人了,更何况说要开发一个解决方案,一个行业的应用,这个他们也没有。所以,我们三层合起来就是一个很完整的企业数据。在这个情况底下其实我们可以合作的。 主持人:其实对于企业来讲,这个就是说像知意图这样的有一定的空间,再一个我们有合作的空间,另外一个对于企业来讲他是需要这样的结合。所以,我觉得确实是在聊完以后的感觉就明确了,已经不那么抽象了。不是那么迷惘的看这个概念,我们这样聊完了之后就发现确实是在你身边,你可能已经身在其中。我们也是希望这个过程当中越来越多的企业发现它的价值,越来越多的企业能够成功获利,当然也包括像知意图这样的。 蒋居裕:谢谢。 主持人:谢谢您。
责编:李玉琴
微信扫一扫实时了解行业动态
微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
|
热门博文
|
|