EMC大数据三部曲 奏响Greenplum Chorus

来源: kaiyun体育官方人口作者:杨雪姣
2012/4/19 14:51:17
kaiyun体育官方人口 :EMC大数据解决方案,包括三大部分:第一、以EMC Isilon、EMC Atmos为核心的存储方案;第二、以Greenplum database、Greenplum HD及Greenplum chorus为核心的大数据分析;第三,以Pivotal labs为基础的大数据应用开发解决方案。



分享到: 新浪微博 腾讯微博

kaiyun体育官方人口 报道,EMC作为将大数据列为重要发展战略之一的厂商,再次发布其重磅产品EMC Greenplum Chorus。Chorus是EMC大数据三部曲第二阶段的“主角”。Chorus是由EMC中国卓越研发集团的技术工程师研发的,历时一年半时间。加盟EMC后,首次亮相的EMC全球副总裁兼中国区总裁蔡汉辉指出,在大数据时代,EMC的使命是引导客户和合作伙伴的大数据之旅,帮助他们利用大数据机遇加速业务转型。

EMC全球副总裁兼中国区总裁蔡汉辉透露,过去几年中国区大数据业务营收增长了10倍,预计未来三年的增长率将保持100%。蔡汉辉对未来三年大数据业务制定的目标是每年翻番。蔡汉辉并不认为如此的增长高不可攀,反而认为这个目标有点保守。“其实2012年相比2011年,我们的目标是要翻三番。”蔡汉辉说。

蔡汉辉介绍EMC中国目前已经具备全面的大数据解决方案,其中包括三大部分:第一、以EMC Isilon、EMC Atmos为核心的大数据存储解决方案;第二、以Greenplum database、Greenplum HD及Greenplum chorus为核心的大数据分析解决方案;第三,以Pivotal labs为基础的大数据应用开发解决方案。

谈到EMC大数据解决方案和其他厂商的差别,蔡汉辉认为EMC是存储厂商出身,数据始终是EMC服务的对象,因此在数据处理上相比更加有优势。此外,EMC将大数据和云计算紧密结合起来,已经开始用云计算的手段来实现大数据的存储和分析等,而目前其他厂商基本还是没有将两者联系起来。

EMC大数据三部曲

蔡汉辉指出:“企业用户只需要三步,就可以实现EMC大数据之旅。”关于大数据三部曲的践行顺序,他认为不必完全按部就班来做,但是只有一步步做扎实了,后续的工作开展起来才有信心。

EMC大数据三部曲的第一阶段就是搭建云基础架构。在这个阶段,EMC提供给企业用户的产品有EMC Isilon和EMC Atmos。其中,EMC Isilon具有超强的横向扩展能力、可靠的安全保护和使用简易等特点,已经被苹果、华大基因、金山软件和浙江省图书馆等企业和单位所采用;EMC Atmos则具有海量、智能、灵活等特点。此外,EMC还提供了Greenplum Database和Greenplum HD,为大数据平台提供大数据分析工具。Greenplum Database主要针对结构化数据,可以分析PB级数据,它具有每小时10TB数据的分析能力;Greenplum HD是EMC的独门“武器”,它可以将非结构化数据转化成结构化数据,然后让Greenplum Database来高效地处理。

第二阶段进入数据科学协作和自助服务。这个阶段会出现社交化风潮,并催生出企业中“数据科学家”的角色,成为驱动大数据处理的新兴力量。EMC最新发布的Greenplum Chorus,就是一个社交化的数据处理平台,能满足这一阶段的要求。

第三阶段就是实时决策,支持大数据的应用程序,实现数据货币化。EMC在今年3月收购了Pivotal Labs公司。PivotalLabs的加入,可以让数据集在Greenplum Chorus完善,让企业用户使用类似Ruby onRails(一个使用Ruby语言写的开源Web应用框架)的现代编程环境,快速构建大数据应用。

Greenplum Chorus的四大功能

EMC中国卓越研发集团Greenplum资深研发产品经理庄富任介绍了Chorus的四大功能——个人沙盒、数据发掘、协作分析和开放数据。

“个人沙盒”是指Chorus可以实现自我服务配置,它是弹性的,可以按需求扩展,同时能实现自动的数据导入。“个人沙盒”实则是用户独有的数据库,使用者可以在“沙盒”里做任何分析而不会影响到生产线里面的效能。“数据发掘”是对企业数据进行搜索,同时寻找数据的相互关联性,并对大数据集进行视觉化。 在这一功能里,Chorus对结构化和非结构化的数据都能进行搜索。

“协作分析”则是指员工间共享工作空间、代码,并发布和追踪得到的洞察。强调协作要灵活并兼具安全。“开放数据”指为分析提供整合的开发环境,通过对第三方数据的访问提供进一步的洞察,并与领先的分析和视觉化工具相衔接。

为了更好地进行数据挖掘和分析,EMC还引入了“数据科学家”这一概念。庄富任认为,“数据科学家”必须有数学背景,熟练掌握工具,同时熟悉企业业务,然后再对数据进行挖掘和分析。目前,EMC已经培养出了一些数据科学家,并在国外和一些大学合作,培养“数据科学家”人才。

此外,EMC全球副总裁兼中国卓越研发集团总经理李映还透露,EMC将会对Chorus开源,其开源版本预计在今年下半年推出,届时任何人都可以下载和使用。业内人士分析,EMC此举有助于扩大Chorus的使用和影响,反过来推动Chorus商业版的销售。

责编:杨雪姣
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map