实施重复数据删除之前需要了解什么?

来源: 比特网
2011/9/28 11:12:15
部署重复数据删除解决方案最常见的挑战与如下因素有关:性能,日渐增加的管理复杂性,以及重复数据筒仓的扩散。


分享到: 新浪微博 腾讯微博
本文关键字: 重复数据删除

数据冗余是数据爆炸性增长的罪魁祸首。最初,面对全部备份、邮件附件和VMware图像等数据,重复数据删除主要以删除数据冗余为重点。然而,随着时间的推移,用户已经认识到了重复数据的普遍蔓延之势。

企业的测试开发数据有很多:复制、备份和归档在你的企业中创造出了多种数据副本,有时用户简单的复制数据完全是处于便利。

研究发现,相比于重复数据删除实际应该处理的数据,现在的过多的数据副本让企业不得不购买、使用和管理2到50倍以上的更多的数据。认识到这样的影响,企业逐渐意识到重复数据删除应该成为其总体IT战略的一个综合和强制性的要素。

“候选人”--哪些人需要重复数据删除?

重复数据删除解决方案使用者的最佳“候选人”是正在面临如下问题的中端或企业用户:

1、数据的呈指数增长,最终会导致存储成本无法控制的局面。

2、备份窗口缩小或不足。

3、恢复所用时间过长,特别是不在重要备份媒介上的那些老旧的数据。

4、把磁带送到灾难恢复(DR)设备的成本、风险和复杂性。

5、备份和归档系统吞吐量过低。

6、电子发现、法规遵从和SLA要求。

7、局域网和广域网的昂贵开销方面存在瓶颈。

如何评估重复数据删除解决方案:

评估重复数据删除解决方案的时候,IT决策制定者应该遵循以下的基本特点:

1、在不进行高昂价格的硬件升级情况下,仍具有扩展的能力。

2、更多的恢复点以及更短的恢复时间。

3、点对点式(Point-and-click)重复数据删除管理。

4、跨厂商、数据类型、资源和平台的内置报告功能。

5、与所有必备应用程序的紧密整合,以减少终端用户的停机时间。

6、简单的易于部署和管理的单一解决方案。

7、在所有地点、应用、存储介质和“及时点”(points-in-time)上可对关键业务数据进行快速安全的恢复。

8、备份性能和可靠的数据恢复的D2D2T优化。

9、恢复中可增加快速、全面搜索。

10、数据完整和安全功能。

11、内置的灾难恢复能力。

12、数据分类(分级)。

13、具有成本效益并且及时的电子发现。

14、支持通用的技术平台。

15、支持单点管理。

部署重复数据删除解决方案的挑战

与磁盘到磁盘备份或服务器虚拟化一样,重复数据删除不应该被人们评价为一个孤立的产品或功能。用户必须考虑重复数据删除对他们的整个数据管理和存储战略背景的广泛影响。部署重复数据删除解决方案最常见的挑战与如下因素有关:性能,日渐增加的管理复杂性,以及重复数据筒仓的扩散。

1. 性能

找到和清除冗余数据对于一个以设备为基础的重复数据删除解决方案来说是极其昂贵的事情。不了解需要进行重复数据删除(deduplicates)的数据的上下文,将在向大多数企业的规模的扩展过程中面临严重的挑战。

如果数据按顺序进行存储,那么存储系统的性能将表现最佳,因此更小的数据集可为多数的重复数据删除解决方案削弱磁盘性能。如果硬生生地共享多种设备上的小部分数据,那么以设备为基础的重复数据删除还需要一般的数据碎片工具作为辅助。随着时间的推移,重复数据删除设备的读、写、备份和复制的性能将变得缓慢而费力。

2. 管理复杂性不断增加

今天的重复数据删除解决方案的表现好像整个工作流程都与它们的价值有着密不可分的关系;从重复数据删除设备上迁移数据到D2D2T工作流程的磁带上几乎是不可能实现的事情。为了得到网络优化的利益,企业不仅需要安装新的硬件,还需要在其远程办公室安装软件

许多重复数据删除解决方案需要企业将硬件和软件的组合变成一个整体,或者购买必须建立在个人手动管理基础上的新的独立设备。额外的管理复杂性可以降低你的存储和网络成本,特别当你减少被重复数据删除的数据量的规模的时候。

3. 重复数据删除孤岛

专业的解决方案制造商占据着市场,将专业存储设计与低性能相结合。这样一来,从重复数据删除设备迁移数据到其他存储设备就几乎成为了不可能的事情。

重复的数据通过很多存储层进一步延伸,包括数据复制品、档案和测试开发副本。往往重复数据删除解决方案只能解决那些领域的其中之一。最后,将来你减少存储消耗的机遇就会变得有限。

责编:杨雪姣
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map