利用分级存储 实现绿色节能需求

作者:华为赛门铁克科技有限公司 贾生宁
2009/3/13 11:38:27
本文主要介绍分级存储是如何节约能源的,通过对分级存储原理的简述,使读者知道如何利用分级存储来实现绿色环保要求。

分享到: 新浪微博 腾讯微博
本文关键字: 分级存储 绿色 节能

建立绿色存储的目的,就是通过优化配置、合理使用资源、采用环保材料、合理的设计等手段,使存储系统的能源消耗降低到最低,同时需要均衡各方面的应用要求。目前业界也有比较成熟的建立绿色存储的方案,数据的分级存储就是这种方案之一。

数据分级存储的定义

数据分级存储,是指数据客体存放在不同级别的存储设备(磁盘、磁盘阵列、光盘库、磁带库)中,通过分级存储管理软件实现数据客体在存储设备之间的自动迁移。数据迁移的规则是可以人为控制的,通常是根据数据的访问频率、保留时间、容量、性能要求等因素确定的最佳存储策略。

数据分级存储的工作原理是基于信息生命周期管理(ILM),通过将不经常访问的数据自动移到存储层次中较低的层次,释放出较高成本、高能耗的存储空间给更频繁访问的数据,这样可以获得更好的总体性价。另外,通过将访问频率较低的数据备份到离线的存储介质(如磁带)中,可以更加有效的利用有限的资源,显著降低维护这些数据所带来的能源开销,同时又可以满足相关法规的要求。

分级存储的存储方式

传统的数据存储结构中,主要分为在线存储与离线存储两部分。在线存储就是将数据存放在磁盘设备上,离线存储则是指将数据通过磁带来保存。其基本架构如下页图“典型的两级存储结构”所示。

传统的二级数据存储采用大容量的磁带做为存储介质。一方面,磁带的大容量的特点满足了系统海量存储的要求,另一方面,离线的数据对能源的消耗也比较低,可以达到降低能耗的目的。但采用传统的数据存储方式,无法减少备份与恢复窗口,无法满足用户对性能的要求。在这种情况下数据多级存储应运而生。

通常情况下,多级存储系统的设备分为三个层次,分别为在线存储、近线存储、离线存储。

在线存储

在线存储主要用来支撑用户的实时在线业务,通常采用高速磁盘存储阵列(例如SAS磁盘阵列、FC磁盘阵列等)。这些高速的存储磁盘具有较高的性能,能满足用户的性能要求。与离线存储相比,其存储容量较小但能耗较高。

近线存储

由于用户需求的不断提高,对系统的RTO指标的要求也越来越高,在这种情况下,传统的两级存储已无法满足这种需要,近线存储也应运而生。近线存储可以充分解决离线存储性能低的问题,大幅减小系统的备份与恢复窗口。近线存储通常使用低速、大容量的磁盘设备来仿真磁带设备,我们称为虚拟磁带库。在线存储设备上的数据在一定的条件下首先写入虚拟磁带库,虚拟磁带库根据一定的配置策略,将自身备份的数据归档到物理磁带中。当需要恢复时,用户只需要从虚拟磁带库中恢复数据就可以了。这样,大大减小了用户的备份与恢复窗口。

离线存储

海量的需要进行归档的数据,无法采用在线存储的设备进行存储,主要受制于成本以及能耗。离线存储采用磁带作为存储介质,其访问速度较低,但能实现海量存储,同时价格也比较低廉。
分级存储的实现方法

传统的两级存储主要是由在线存储磁盘与离线磁带设备组成。传统的两级存储结构在存储侧由两部分组成,分别为在线存储与离线存储。受备份服务器上的备份软件控制,数据定时从在线设备上备份到离线设备中,保证了数据的安全。但随着数据量的不断增大,由于备份到离线存储上的数据无法满足用户的恢复需求,因此需要不断扩充在线存储的容量来满足数据增加的要求。这些不断扩充的容量,侵蚀着企业的宝贵的资源。

分级存储也正是在这种情况下产生的。

多级存储与两级存储相比,多了近线存储设备。在线存储由高速的磁盘设备组成(如SAS、FC等高速设备),近线存储由大容量的SATA磁盘组成,离线存储由大容量的磁带设备组成。备份服务器上的备份软件控制在线存储上的数据定期备份到近线存储中,近线存储上的数据依据一定的策略自动将使用频率较低的数据归档到离线存储中。当在线系统发生灾难后,可以直接从近线存储中恢复数据,这样,一方面大大提高了备份速度、减小了备份窗口,另外也大大提高了系统的恢复速度。

分级存储是如何降低能耗的

分级存储提高资源使用率,降低能源开销

通过将使用率低的数据迁移到功耗低的设备上,尤其是将数据迁移到大容量的离线设备上,可以释放这部分数据占用的系统资源、提高资源使用率、减少设备使用的数量,从而有效减少存储设备的电力需求、保证重要在线业务的能源需要,同时降低了降噪、冷却所带来的额外的能源开销。

分级存储采用不同的存储设备,降低能源消耗

在线存储、近线存储、离线存储对系统的性能要求并不相同。在线存储对性能要求较高,可以采用高速的磁盘设备。但采用高速磁盘作为在线存储设备时,其能耗要高于低速的磁盘设备(如SATA磁盘等)——FC磁盘正常工作时的功率为27.73W,但大容量的SATA磁盘正常工作时的功率仅为12.8W。如果保存100T的数据,需要的FC磁盘与SATA磁盘的个数分别为334与100(FC磁盘按300GB/块、SATA磁盘按1TB/块来计算),那么要保证这些设备的运行,FC磁盘与SATA磁盘的电力需求分别为9262W、1280W(这还没有计算在线存储RAID等额外的硬盘开销)。从这一点可以看出,在近线存储设备中,采用高容量的低速磁盘来存储在线存储不经常访问的数据,可以大幅降低能源的消耗,达到节能的目标。

与磁带设备相比,近线存储中采用磁盘设备,可以大幅提高系统的备份与恢复速度。以华为赛门铁克公司的VTL3605虚拟带库为例,数据备份到VTL3605中备份速度可以达到1.5TB/h,但离线存储的备份速率只有288GB/h——单单从这一点来看虚拟带库的备份速度是远远高于磁带设备的。用户使用时,可以综合考虑性能与业务的需求,将实时性要求较高的关键业务运行在高速、高能耗的在线设备上,而将对实时性较低的数据迁移到低能耗的近线设备上,可以有效的降低能源的开销。

目前出现的SSD(Solid State Disk,固态硬盘),兼顾了性能与环保的要求,可以使用在在线存储中,以降低系统能耗并提高系统的性能。但由于其成本较高,目前在市场上还未得到规模化的应用。

分级存储减少设备占用的空间,减少资源的消耗

要满足日益增长的数据对存储设备容量的要求,就必须提供较多的物理磁盘,这样,在能耗、设备数量、空间上都必须不断的进行扩充。由于高速磁盘的密度低于低速磁盘,因此其容量也低于低速磁盘——例如,高速的SAS磁盘最大只能提供300GB的存储空间,但低速的SATA磁盘可以提供高达1TB的存储空间。所以,我们可以将访问频率较低数据迁移到大容量的设备上,释放宝贵的在线资源给关键的业务。同时在近线设备上采用大容量的低速设备、采用空间利用率较高的RAID5算法、数据及时归档等处理措施,都可以大幅减少磁盘的数量,减少用户扩容的风险,降低用户机房的设备占有率,从而减少设备对资源的消耗。

分级存储中的数据生命周期,保证随时释放存储资源

分级存储是根据信息生命周期来对数据进行管理的,对于一些过期无用的数据及时从设备中删除,同样可以达到节约资源的要求。

总结

在信息化建设过程中,华为赛门铁克综合考虑数据的属性,在条件许可的情况下尽量采用数据分级存储的方式来保存数据,达到降低系统能耗的目标。能源短缺的问题正在逐步被人们所重视,在企业信息化过程中,我们需要尽量降低能源的消耗——这不仅仅可以降低企业的维护成本,同时也是社会的需要。

专题:节能与优化IT企业CIO过冬良策

责编:田启佳
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map