|
亚马逊将提供低价大数据存储服务近日,AWS(亚马逊网络服务)发布了一项云端的数据仓库服务——Redshift,并宣称此服务将会带来比传统本地数据存储更好的性能和扩展性,价格却比后者低很多。 “根据市价计算后我们发现,如果想要自己组建一个大型数据仓库,每TB的存储空间通常每年会让你花掉19000到25000美元,”AWS的战略师Jeff Barr在博客中表示,“亚马逊的Redshift包括一切你所需要的功能,价格却低于每TB每年1000美元。” 除了成本优势,亚马逊还宣称该业务的管理服务功能还会让数据仓库管理员免受监控、调试、备份、升级软件及错误恢复的困扰。用户只需登录和管理AWS管理控制台(Management Console)的Redshift节点和集群,即可轻松处理海量数据。该业务的存储空间小至几百GB,大至超过1PB,完全覆盖各类企业的需求。 Redshift采用关系数据库技术,使用SQL作为其查询语言,并与现存的BI工具相兼容。毫无疑问上述数据库就是ParAccel,因为亚马逊是该公司的一个投资方,且关于Redshift的声明中承认其关键技术来自于ParAccel。 ParAccel的数据库有许多先进的特性,比如柱状数据存储及先进的压缩技术。但这些技术同时也提供给像EMC Greenplum, HP Vertica和Teradata这样的竞争者,甚至会在下一版本的Oracle数据库中出现。尽管亚马逊声称“比传统快十倍”,但存储性能最终还是取决于负载的大小及“传统数据库”间的比较。 Redshift与先前的RDS(Amazon Relational Database Service,亚马逊关系数据库服务)的区别在于,前者专门用于仓库存储及分析(与事务型数据库相对)且能够适应大数据的规模。“RDS采用的是微软的SQL Server、Oracle或是MySQL数据库,但这些数据库并不能胜任PB级别的数据仓库处理,”Jaspersoft的产品及联盟副总裁Karl Van den Bergh说。Jaspersoft同MicroStrategy公司是Redshift在智能商务方面的合作伙伴,但亚马逊表示其他BI合作伙伴将会接踵而至。 尽管大数据分析是一个非常有潜力的方向,但亚马逊似乎更想向中小型公司强调其数据仓库业务的廉价性。客户能够同时运行2个节点类型,其中每个节点能够容纳2TB或16TB(两节点无需相同)的压缩数据。据亚马逊官方公布,一个2TB的数据仓库每小时仅花费0.85美元,预留实例(Reserved-instance)更是低至每小时0.228美元,或每TB每年1000美元。 “亚马逊的行事方式就是打乱市场原有格局,并提供史无前例的高性价比服务,”Van den Bergh说,“数据仓库有很大的市场,就看能将它开拓多少了。” 亚马逊并没有在Redshift网站上详细说明各大小公司上传及同步其在Redshift中数据的方式。从单一数据源上传数据不复杂,但随着数据源的增加,数据传输的延迟和复杂度将会成倍增长。也许BI系统也须运行在云端以避免企业在本地和云端间来回转移数据而浪费大量时间。
责编:刘沙
微信扫一扫实时了解行业动态
微信扫一扫分享本文给好友
|
最新专题
|
|