分层存储中数据迁移时问的设计

来源: 互联网
2013/8/19 14:31:52
在数据迁移中,迁移时间的确定尤为重要,它必须考虑到使用存储的应用需求以及存储系统本身的特性。

分享到: 新浪微博 腾讯微博
本文关键字: 分层存储 数据中心

引言

由于信息数据进入高速增长的时代,在满足存储容量需求的同时,用户需要根据数据的特性选择相应的存储介质进行存储以提高存储系统的性价比。分层存储系统就是将数据存储在不同层次的介质中,并在它们之间进行自动或者手动的数据移动和读写等操作。因此设计一个数据迁移策略来实现数据在各个存储层及时有效的迁移是个关键的问题。

在数据迁移中,迁移时间的确定尤为重要,它必须考虑到使用存储的应用需求以及存储系统本身的特性。例如在数据的容灾备份中,迁移时间可根据数据的安全需求来设计;对一些商业存储系统,迁移时间可根据业务程来设计;而在高性能计算中,由于各个计算任务的规模和复杂度等各不相同,计算和存储过程不明确,迁移时间设计就比较复杂。同时,高性能计算追求较快的存储速度,因此提高高速存储层的利用率也非常重要。

目前国内外对分层存储中数据迁移技术进行了大量的研究,但对迁移时间研究相对较少。]根据存储容量来设置数据迁移的时问。若将容量设置过高,可能会因为存储层内数据增至过快而导致迁移失败,设置偏低会降低存储的使用率,因此迁移时间的设计需要分析数据的增长趋势和存储系统传输速率对迁移的影响。

1 分层存储和数据迁移

分层存储系统一般包括三部分。第一部分是磁盘池,它包括了多种存储介质的物理磁盘,并可通过这些介质的物理特性进行分层管理。例如由SSD硬盘、SATA硬盘构建的存储系统中,可分为SSD层和SATA层。第二部分是位于中间的存储控制部分,它具有管理数据分布和迁移、实现存储虚拟化等功能。最后部分是提供给不同应用使用的逻辑存储系统,它一般由Volume组成。整个分层存储基本架构如图1所示。

\

图1 分层存储系统的基本架构

分层存储控制层中的数据迁移实际上是在多层存储内基于策略的自动放置文件的过程。迁移一般过程是:根据策略规则,系统在指定的存储层创建和扩展一些文件;当迁移被触发且执行时,将文件价值满足迁移条件的文件重定位到相应的存储层,实现迁移。其中文件开始迁移的时间称为迁移时间。文件价值指的是文件在整个文件系统中的重要性和活跃度,它决定了数据迁移策略能否有效执行。迁移条件根据实际需求来设定,由迁移条件决定参与辽移的文件。

2 迁移时间的分析与设计

某一层存储的数据迁移时间与存储容量相关,但简单或凭经验去设置一个容量值来确定迁移时间是不合理的,它没有反映存储容量的变化趋势,也没有结合存储设备的特性和应用需求来使用存储,同时可能造成因容量增长过快而无法及时地迁出数据的情况,即迁移堵塞。本文从存储系统的传输速率、存储层使用量和使用量的变化趋势三方面来考虑迁移时间,下面给出它们的描述。存储系统的传输速率。存储系统的传输速率包括读出/写入存储系统的速率和系统内部数据在各存储层迁移的速率。它们受限于文件系统、网络、raid设置、存储系统和存储介质等因素。实际的速率值取各相关因素对应速率中的最小值。

存储使用量。记录存储介质内存放数据的容量大小。它包括存储层的使用量和存储系统的使用量。

存储层使用量增长率。反映存储层的使用量在某个时间段的增长趋势。

如果存储层的使用量在某个时间段按固定的速率增长,称之为线性增长(1inear increase,LI),反之是非线性增长(nonlinear increase,NI)。在非线性增长盼隋况下,如果增长率高于固定的增长率,表明存储层使用量高速增长(SU—per linear increase,SLI),反之表明存储层使用量低速增长(10w linear increase,LLI)。图2显示了LI、SLI和LLI在一段时间内存储层容量的变换。

\

图2 LI、SLI和LLI下存储层使用量的变化

在数据存储过程中,如果存储层使用量增长过快,并且存储系统本身传输速率比较低,就需要对它进行数据迁移,以免迁移堵塞导致迁移失败。

迁移上限和迁移下限。它们是一个使用量的阀值,迁移上限大于或等于迁移下限。

由上述迁移条件,本文设计了迁移时间的判定过程,如下:

(1)定时监控某存储层使用量,当其超过迁移下限a时,进入(2)。

(2)若使用量继续增加超过迁移上限b时(b>a),执行(4)。反之进入第(3)步。

(3)若写入存储系统的速率超过存储系统内部数据迁出最大速率时,或在单位时间t内满足表达式(2),则执行第(4)步。反之转到第(2)步。

(4)执行数据迁移。

(5)数据迁移完毕。

本文结合使用量变化趋势、传输速率和迁移上下限来设定迁移时间,能有效的缓解迁移堵塞。主要方法包括:

降低式(2)中固定速率,将符合迁移条件的文件数据提前迁移;降低迁移下限,扩大可执行迁移的时间范围。迁移上限和下限的设置可改变存储层的利用率,将迁移上限和下限适当提高,就可提高相应存储层的利用率。整个判定过程考虑了系统的硬件特性和应用的需求,并采用了数学公式进行定量分析,这为数据迁移的实现提供了很好的基础。

责编:驼铃声声
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map