Data Domain首席执行官谈重复数据删除

作者:IT168存储频道
2008/4/18 0:00:00
本文关键字: 存储 方案 案例

重复数据删除正在成为业界广为追捧的热门技术。所谓重复数据删除技术,就是指扫描工作服务器磁盘数据,判断数据是否为重复或冗余。其原理就是通过算法切割磁盘里的数据成为区块(Block)或是区段(Segment),并为每一个分割单位求出一个特征值(unique ID),即可以代表此区块的数据。

“异军突起的重复数据删除技术,将会改写存储行业的经济规则,”有分析家说。这种说法的来源,是因为重复数据删除意味着只备份经过更改的数据,这与传统的每周或每天备份所有数据的模式形成了鲜明对比。对于那些希望降低带宽成本并改善备份性能的企业来说,重复数据删除是一个极具吸引力的概念。

重复数据删除技术在数据安全和数据保留方面,包括备份和恢复、长期归档、灾难恢复和法规遵循等,都发挥着越来越大的作用。而在众多提供重复数据删除技术的厂商中,Data Domain已经成为这个技术领域内被公认的领导者。

成立于2001年的Data Domain公司,是重复数据删除技术领域的最早开拓者,到目前为止,全球已经有超过1500多家公司利用Data Domain的解决方案降低备份费用和简化数据恢复过程。2007年,Data Domain在全球存储市场取得了不俗的成绩,在进入中国市场不久之后也得到了广泛的认可。Data Domain的新一代内嵌重复数据删除技术的企业级保护存储系统DD580,在2007存储中国峰会上获得了“2007 VTL年度产品”奖,还被计世网评为“2007年度产品”。

在这个竞争日益激烈的存储市场,Data Domain公司是如何看待新产品和技术、行业动态和用户需求的呢?或许,我们可以从Data Domain公司的首席执行官Frank Slootman先生的访谈中略知一二。

“2007年是Data Domain大跨步向前发展的一年,我们的市场领导地位得到了进一步的巩固。”Frank Slootman在几次谈话中提到(详见视频谈话:http://www.datadomain.com/leadership/index.html)。当今,对大多数IT主管来说,最具吸引力的两个存储变革无疑是服务器虚拟化和重复数据删除存储。这两个技术有着相似的益处:能提高硬件资产的使用效率,降低存储总成本。而重复数据删除恰恰可以用来解决服务器虚拟化所产生的数据保护和存储难题。这无疑给Data Domain的发展提供了前所未有的契机。

Frank Slootman认为存储市场大致可分为三个部分:GB级数据存储市场,TB级数据存储市场,PB级数据存储市场。在GB级市场,你可以看到软件复制厂商如Avamar和PureDisk,以及WAN加速产品供应商Riverbed和Cisco。这完全是一个以网络化的市场领域。

而Data Domain的栖身之所是TB级数据存储市场,一个商业化和分布式的企业市场。Frank Slootman所说的“分布式企业”指的拥有多处办公地点的企业。磁带带来的麻烦,这类企业的体会最为深切,因为分支机构和办公地点越多,运输磁带/恢复数据的麻烦就会呈几何级增长。而且,你还必须在所有的办公地点都配备存储技术人员。

Frank Slootman说,人们认为Data Domain是一家存储公司,而不是简单的重复数据删除公司、备份公司或者是数据保护公司。人们一般只是把重复数据删除技术看作一个简单的功能,而事实远非如此。重复数据删除是一个能改变基本存储格局的重要技术。它是一个通用技术,虽然最初我们用它来做企业备份。对那些不能保存在磁带上的数据进行长期保留,重复数据删除技术一般能实现1/4到1/5的数据压缩比。咋听来这算不了什么,可是仔细想想,你实际上是减少了75%的数据、75%的数据中心空间以及75%的电源和散热费用!而实际上,Data Domain能实现远高于普通水平的达到1/20的压缩比!难道这还不足以让人更加欣喜若狂么?

重复数据删除在成本上可能产生的巨大收益,让更多的用户无法抵御它的诱惑。一家总部设在明尼阿波利斯的律师事务所Winthrop & Weinstine使用了重复数据删除技术提供的新的备份模式,该事务所使用的是Data Domain提供的备份和恢复软件,将数据复制到远程站点。当数据量被压缩了20倍左右之后,基于磁盘介质的备份模式不再昂贵得无法接受,而该事务所也得以摆脱了传统的磁带备份, 有了全新的容灾架构选择。

一些人认为重复数据删除技术将是每个系统的必要组成部分,像加密术是磁盘驱动的组成一样。Frank Slootman是怎么看待这种看法的呢?Frank Slootman认为事实上,要确保此技术在所需要的水平上执行,对工程和技术来说都是一项挑战,其将数据减少到你所期望输送的数据量,并保证你所需要数据的完整性和可靠性。要使一个存储系统稳定很难,因此你仍需运行一个有弹性的存储系统,这一系统可能会出现如驱动问题或者动力问题。当你删除数据时,可能会导致系统失灵。有很多问题需要处理,而人们根本不明白这一技术的复杂性。一年以前人们认为这将是一个所有产品上都具有的功能。而现在很多人说,“我们发现这一技术没看起来那么简单。”

责编:
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map