根——数据存储基本知识
数据存储与网络
随着企业业务的开展深入、E化的程度加深,企业对各种应用的依赖程度越来越深,各种传统应用如Web、E-mail、文件服务等规模的不断深化、各种新型应用如ERP、CRM等层出不穷。各种应用中的根——数据对于企业来说越来越重要,企业已经形成了数据是最重要资源的概念,维护数据的安全、可用是至关重要的。网络技术也对计算机平台的演化产生了相应的影响,对计算机处理能力和相关数据需求的不断增长,更快,可达性更好的存储技术将得到更多的市场驱动。
在过去的10至15年中,商业的模式发生了重大的改变。这其中,基于因特网的商业模式的爆炸性增长给信息的获取和存储技术带来了新的挑战。今天,越来越多的业务应用不仅要求数据必须保证7×24可用,同时还要求在存储设备出现故障甚至发生区域性灾难(诸如洪水、火灾、恐怖袭击、大规模电力故障)的情况下,也要保证数据的安全、可用。因此,发展一种具有成本效益的和管理的先进存储方式就成为必然。
体系和存储架构
从数据存储方式来说,最早出现的存储系统是DAS(Direct Attached Storage,直接附加存储,又称直连存储),也就是硬盘或磁盘阵列直接通过各种接口(其中包括我们熟悉的SCSI、IDE、SATA、FC光纤通道)直接连接到服务器,随着数据量的增加以及网络时代的到来和对系统可管理性、可扩展性的进一步要求,两种新网络存储架构出现了:NAS(Network Attach Storage,网络附加存储)、SAN(Storage Area Network,存储局域网络)。
实际上,NAS和SAN的概念并不是泾渭分明的。
NAS网络附加存储的概念我们举个实际的例子比较好解释。如果我们将后端磁盘阵列配合一个“瘦”操作系统,然后通过IP局域网将磁盘划分给客户端使用,这样的数据存储系统就称为NAS网络附加存储。NAS类似于一台可以直接连接网络的文档服务器。
NAS存储系统的特点是通过基于IP网络的网络文件协议向多种客户端提供文件级I/O服务,客户端可以在NAS存储设备提供的目录或设备中进行文件级操作。当一个用户或应用程序试图访问文件时,经过解释的I/O请求被重定向到网络传输路径。这些I/O请求经过IP网络传输到NAS服务器端,由那里的网络文件协议接收,随后解包并处理客户端和设备的映射关系,最后将正常的I/O操作请求交给服务器上的文件系统处理。
SAN可说是DAS网络化发展趋势下的产物。SAN是一种面向网络的存储结构,是以数据存储为中心的。SAN采用可扩展的网络拓扑结构连接服务器和存储设备,并将数据的存储和管理集中在相对独立的专用网络中,面向服务器提供数据存储服务。服务器和存储设备之间的多路、可选择的数据交换消除了以往存储结构在可扩展性和数据共享方面的局限性。
通过协议映射,SAN中存储设备的磁盘或磁带表现为服务器节点上的“网络磁盘”。在服务器操作系统看来,这些网络盘与本地盘一样,服务器节点就像操作本地SCSI硬盘一样对其发送SCSI命令。SCSI命令通过FCP、iSCSI、SEP等协议的封装后,由服务器发送到SAN网络,然后由存储设备接收并执行。服务器节点可以对“网络磁盘”进行各种块操作,包括FDISK、FORMAT等,也可以进行文件操作,如拷贝文件、创建目录等。
这两种网络存储解决方案的诞生,可以说是企业存储上非常重要的变化,DAS、NAS、SAN这三类存储架构和这些存储架构的组合帮助各类企业满足他们各种各样个性化的存储要求。
然而在那种情况下需要那种类型的存储系统呢,下面对DAS、NAS、SAN的优缺点进行详细的分析使得我们的读者有足够深入的认识。
在DAS这种结构中,服务器实际上起到存储转发数据的作用。这一存储体系结构的优点就是速度快,系统造价低,但是存在以下一些不可克服的缺点,已经不能够满足网络时代的应用需求。
容量限制: 存储容量的扩展依赖于所连接的服务器,如果服务器的接口或可供挂接的驱动器已满(并行SCSI总线最多可连接15台设备),就只有另购服务器来扩容了。
连接距离有限: 并行SCSI总线的最长距离只有25米。
不易于共享和管理: 数据依附于服务器分散存储,且数据访问依赖于特定的平台和文件系统,数据不易共享和管理。
从厂商的有意无意的宣传中我们总是将NAS和SAN划分为两类差别很大存储架构,其实两者在很多方面都是相近的,NAS可以算作IP-SAN中的一种。
在NAS的系统中存在如下的缺点:
其一是传输能力有限。在NAS中,数据的传输通过现有的局域网实现,但局域网原本是用来实现消息传递的,只适合短暂的突发数据传输,不能满足大容量连续数据传输的要求;同时,网络上大量计算机之间的通信也会占用有限的网络带宽,所以当网络规模较大时,必然会导致数据传输速率减慢。
其二是可扩展性有限。虽然当存储空间不足时,在网络中增加一台NAS设备非常容易,但新的NAS设备要求有新的IP地址,无法与原有的NAS设备集成为一体,不能形成一个连续的文件系统,从而增加了存取和管理的复杂度。
其三是数据备份能力有限并且不能对数据库服务提供有效的支持。通常,NAS设备不能支持存储设备之间的直接备份,只能采用基于网络的备份,这样会在数据备份时占用大量的网络带宽,严重影响网络上其他应用的运行,而且数据备份的速度也相对较慢。
SAN存储的特点
相对于NAS网络存储,SAN存储有着如下的优点。
其一是为每台主机提供了更多的可控存储容量。SAN并没有提高单个磁盘驱动器的容量,也没有增加主机系统中支持的主机 I/O控制器的数量,但它能显著提高连接到每台主机I/O控制器的设备数。它还提供了通过级联网络交换机和集线器来扩展容量的方法,例如,光纤仲裁环网能支持多达126台设备,而对于交换结构的光纤网络和IP网络来说,SAN具有无限寻址的能力。
其二是可提供更高的传输带宽。目前光纤网络可提供4Gb/s的带宽,而千兆以太网可提供1Gb/s的带宽。此外,与共享带宽的总线和网络相比,使用交换网络的SAN为数据存取提供了更好的可扩展性,网络的传输带宽可以成倍地增长。
其三是可提供更长的连接距离。SAN能以高速在很长的距离上运作,在采用光纤通道协议(Fiber Channel Protocol,FCP)的FC-SAN中,使用单模光纤且不使用重发器,就可支持长达10公里的数据传输;而使用IP网络进行数据传输的IP-SAN则可以在广域网上传输数据,从而使数据的存取不再受区域的限制。
其四是在数据可用和共享方面的优势。服务器和数据的分离以及面向网络的集中存储使数据的安全性和可用性大大提高。而且,利用SAN的远距离连接能力,通过数据镜像等操作,即使系统遭受区域灾害(如洪水、火灾、大规模电力故障等),也能很快完成数据的灾难恢复。同时,面向网络的集中存储和多路径的数据交换使数据共享变得非常容易。
架构中的基本概念
近线和离线存储
所谓分级存储,就是根据数据不同的重要性、访问频次等指标分别存储在不同性能的存储设备上,采取不同的存储方式。这样一方面可大大减少非重要性数据在一级本地磁盘所占用的空间,还可加快整个系统的存储性能。在这里就涉及到几种不同性能的存储设备和不同的存储形式了。
目前常用于数据存储的存储设备主要有磁盘(包括磁盘阵列)、磁带(包括磁带机和磁带库)和光盘(包括一切CD-R、CD-RW、DVD-R、DVD-RW等光盘塔和光盘库设备)。从性能上来说,磁盘当然是最好的,光盘次之,最差的是磁带。而从价格上来说,单位容量成本上升磁盘最贵、光盘次之,磁带最低。这就为我们不同的应用追求最佳性价比提供了条件,因为这些不同的存储媒介可应用于不同的存储方式中。这不同的存储形式包括在线存储(OnStore)、近线存储(NearStore)和离线存储(OffStore)。
在分级数据存储结构中,磁带库等成本较低的存储资源用来存放访问频率较低的信息,而磁盘或磁盘阵列等成本高、速度快的设备,用来存储经常访问的重要信息。数据分级存储的工作原理是基于数据访问的局部性。通过将不经常访问的数据自动移到存储层次中较低的层次,释放出较高成本的存储空间给更频繁访问的数据,可以获得更好的总体性价比。
今天企业的数据中心非常复杂,数据保护是其关键。但是,并非所有的数据都具有同样的价值,也并非所有的企业都具有同样的需求。的确如此,通常认为企业中的关键和非关键数据量也符合“二八原则”,就是只有20%的关键数据,而80%都是非关键的。系统中60%至80%的数据经常在一个月,甚至一年中都不会被访问。而在经常访问的数据中,重要性差别也十分突出,有的数据与用户的业务联系紧密,可靠性、可用性及性能要求都很高,有的尽管经常使用但是与业务联系不是特别紧密。一般来说,重用数据的概率自数据创建3天之后就会下降50%,当数据创建30天后,重用的概率通常会降至很低,而高达90%的数据超过90天后就不会或很少被读取。为了提供良好的数据保护,IT部门通常都保留巨大的空余空间,用以防止出现容量不足的现象。
IT企业总是要面对增长起来无休无止的数据量。各种应用都在创建越来越大的文件,用户也很少删除数据和存档,这就导致要访问旧一些的文件已经变得非常困难。之所以要采取分组存储,是因为它既能最大限度地满足用户随时访问所有需要经常使用的数据,又可使存储成本最小化。综合起来,可以得出分级存储的优点主要体现在以下两个方面:
1.减少总体存储成本
在传统的在线存储中,所有数据都存储在一线磁盘存储设备上,而由于绝大多数数据的访问率并不高,占住了大量宝贵的磁盘空间,在一定程度上是一种浪费。如果把这些数据转移到存储性能稍低的磁盘(如IDE或SATA接口磁盘)或光盘存储设备上,存储成本可得以大幅降低。
2.提高整体系统性能
由于绝大部分数据转移到下级存储设备上,那需要时刻保持在线的数据就少了,系统资源的占用也就少了许多,整体系统性能自然也就提高了。如果采用了离线存储方式对很少使用的数据保存在像磁带这样的离线存储媒体上时,则不仅可提高系统性能,还可确保数据的安全性。
iSCSI技术
随着TCP/IP在互联网上的发展,TCP/IP已经成为了事实上的网络协议标准,现有的架构、标准、协议如果结合FC-SAN,是否能够减低SAN系统成本呢?厂商推出了IP-SAN和ISCSI,IP-SAN主要解决的是SAN的管理问题,ISCSI解决是SAN的成本问题。ISCSI的出现,标志着低价化SAN方案的问世,一圆中小企业也能够建置SAN的梦想。
自2003年SNIA(存储网络产业协会;The Storage Networking Industry Associate)通过ISCSI协议后,厂商有了统一的IP-SAN方案,另外2003年微软宣布了在Windows 2003中提供ISCSI支持,ISCSI在此之后获得了很大发展。ISCSI理论上可以用在DAS、NAS、SAN各种存储方案上面,不过目前主流还是在SAN上的应用。
所谓ISCSI就是通过IP协议将SCSI区块数据转换成网络封包的一种传输标准,它和NAS一样透过IP网络来传输数据,但在数据存取方式上,则采用与NAS不同的,而与FC-SAN相同的Block Protocol协议。IP协议使得ISCSI可以使用普通交换机,而不必使用昂贵的光纤交换机,而且懂得IP协议的人很多,比起光纤SAN的人员培训要省不少费用;使用IP协议的另外一个好处是如果随着以太网的速度进一步提升,ISCSI的网络传输速度也会提升,采用10G以太网协议的ISCSI甚至会超过下一代光纤FC-SAN的4G标准;另一方面采用了与FC-SAN相同的Block Protocol协议,虽然无法与FC-SAN想比,不过在存储速度超过使用文件协议的NAS不少。
左下图是一个比较简单的iSCSI存储系统结构图,这是一个采用统一数据存储中心的结构图,通过上面我们清楚地知道该系统虽然是一个新建的iSCSI存储系统,但它并没有改变原有的网络结构。
首先我们需要了解的是客户端与数据存储中心的连接,它们之间的连接有两种方式。一种是在客户端上采用普通网卡加协议转换软件的形式,另外一种是直接在客户端采用iSCSI适配卡的连接方式。采用普通网卡加协议转换软件的形式虽然能节约资金投入,不过这种连接方式会造成CPU资源大量被占用,并且转换率也不高。而采用iSCSI适配卡连接的方式,会大大提高数据传输速度,并且占有CPU资源非常小。实际上iSCSI适配卡也相当于一块网卡,不过iSCSI适配卡价格比较昂贵。因此,用户在选择时一定要根据自己的实际情况决定。无论硬件还是软件方式都称为iSCSI Initiator。
iSCSI服务器主要的作用在于将SCSI指令封包并置入到TCP/IP封包里,也就是当客户端发出请求后,iSCSI命令和数据达到iSCSI服务器进行处理,然后iSCSI服务器根据请求命令调用数据存储中心的数据反馈给客户端用户,它主要用来为客户端调用存储空间或者存储的数据。
交换机在系统中的作用跟网络中普通的交换机一样,只是起一个连接iSCSI存储服务器和iSCSI存储设备的作用。不过也有厂商推出专用的iSCSI交换机,如思科的5400系列iSCSI交换机。
iSCSI存储设备主要是用来保存大量的数据,也就是我们通常所说的磁盘阵列等。在交换机与iSCSI存储设备这里我们能看出,如果我们需要增加整个iSCSI系统的存储容量,只需要购买存储设备连接到iSCSI交换机上面就可以了,这样就大大增加了整个iSCSI系统的可扩展性,并且在增加存储设备的同时,我们并不需要关掉服务器等。
在存储设备这端负责将SCSI协议从IP包中分离出来的设备称为iSCSI Target。iSCSI存储设备已经包含了iSCSI Target,如果仅仅是普通磁盘阵列那么就需要购买一个iSCSI网关作为iSCSI Target连接阵列和iSCSI交换机。
数据存储的容灾
容灾分为数据容灾和应用容灾。数据容灾可以保证数据不丢失,但不能保证服务不中断;应用容灾则更上一层楼,它在异地建立一套与本地数据系统相当的冗余系统,当灾难出现后,远程系统可以迅速承接本地应用系统的业务,保证服务不中断。在实际应用中,数据容灾依靠备份技术实现;应用容灾则必须依靠远程镜像技术和集群技术。在这里我们主要讨论的是数据容灾,也就是数据备份。
数据备份就是将数据复制到独立于工作磁盘的存储介质上面,从而保证数据的安全。从备份方式上面说有离线备份和在线备份,从备份等级上面说有完全备份和增量备份,从备份途径上说有LAN-Free和无服务器备份;从存储介质上面区分有磁盘和磁带。
离线备份可以说是备份的初级方式,但是由于目前企业环境不允许长时间停机甚至不允许停机,留给备份的时间越来越短,因此在一些关键系统中都是采用的在线备份的方式。快照技术将时间引入了数据存储,用户在使用当前数据的同时,也可以看到以前某个时间点的数据,并能通过它很方便地实现在线备份。
完全备份顾名思义很好理解,就是把整个数据无论新旧完全备份一次。而增量备份只是备份上一次修改以后的数据。增量备份包含有差别备份和累计备份:差别备份是从上次备份后修改过的文件的拷贝;累积备份是指自上一个完全备份后被修改的全部文件拷贝。如果企业数据量很庞大,完成完全备份的时间会很长,因此企业常常将两种备份方式结合使用。
目前数据备份主要方式有:LAN 备份、LAN Free备份和SAN Server-Free备份三种。LAN 备份针对所有存储类型都可以使用, LAN Free备份和SAN Server-Free备份只能针对SAN架构的存储。
基于LAN备份 传统备份需要在每台主机上安装磁带机备份本机系统,采用LAN备份策略,在数据量不是很大时候,可采用集中备份。一台中央备份服务器将会安装在 LAN 中,然后将应用服务器和工作站配置为备份服务器的客户端。中央备份服务器接受运行在客户机上的备份代理程序的请求,将数据通过 LAN 传递到它所管理的、与其连接的本地磁带机资源上。这一方式提供了一种集中的、易于管理的备份方案,并通过在网络中共享磁带机资源提高了效率。
LAN-Free备份 由于数据通过LAN传播,当需要备份的数据量较大,备份时间窗口紧张时,网络容易发生堵塞。在SAN环境下,可采用存储网络的LAN-Free备份,需要备份的服务器通过SAN连接到磁带机上,在LAN-Free备份客户端软件的触发下,读取需要备份的数据,通过SAN备份到共享的磁带机。这种独立网络不仅可以使 LAN 流量得以转移,而且它的运转所需的 CPU 资源低于 LAN 方式,这是因为光纤通道连接不需要经过服务器的 TCP/IP 栈,而且某些层的错误检查可以由光纤通道内部的硬件完成。
SAN Server-Free备份 LAN Free备份对需要占用备份主机的CPU资源,如果备份过程能够在SAN内部完成,而大量数据流无需流过服务器,则可以极大降低备份操作对生产系统的影响。SAN Server-Free备份就是这样的技术。
备份的物理设备有磁盘和磁带两种。磁盘备份速度快,恢复速度也快,但是备份容量没有磁带大且单位价格高;而磁带备份容量大、单位容量便宜,但是备份和恢复的时间消耗较长,企业可以灵活根据自己的数据量和预算情况灵活选择备份设备。不过随着SATA磁盘的出现情况有所变化,SATA磁盘的单位价格已经大大降低,磁盘有取代磁带的趋势,厂家推出的产品有VTL(Virtual Tape Lib虚拟磁带库),设备备份和恢复速度很快,其价格又接近于传统的磁带库。
目前有些厂家推出了将磁盘和磁带结合的产品,利用高速磁盘作为缓冲器,先将备份数据写入磁盘,然后再写入磁带,这个就是D2D2T(DISK TO DISK TO TAPE)。
存储系统的发展趋势
现代数据存储系统已经发展成为一套复杂的、集成程度很高的专用系统,然而随着这样存储系统的发展,复杂的系统结构带来了很多诸如管理复杂、价格昂贵、各存储厂家不好整合的种种问题。目前存储系统厂商也看到了存储系统存在的这些问题,并着手去解决这些问题。我们下面就一一的介绍存储系统的这些主要新趋势。
1. 数据存储的结构化趋势(虚拟化存储、异构、Infiniband)
数据存储的结构随着存储系统的发展越来越复杂,现代的数据存储系统包含了网络设备、存储管理设备、存储设备等多种设备,然而由于没有类似网络的标准分层,各家厂商产品以及解决方案之间的兼容的情况不是很好。例如当一家企业购买了某种磁盘阵列产品之后,随着企业的发展需要更加完备的存储方案,然后该企业IT经理却沮丧的发现,新购买的NAS存储或SAN存储很难和原来的磁盘阵列整合在一起,企业不得不放弃以前的磁盘阵列产品,造成IT投资的浪费。
实际上数据存储的结构化也顺带解决了存储设备的异构问题,由于存储设备的不断发展。各种存储方案、存储产品、存储网络设备、存储接口的互操作性是个难题,有时候甚至是一个“不可能的任务”。存储系统如果能够提出一个类似网络分层的统一标准,这些问题将将得到解决。
现在厂商已经推出了一些部分解决问题的方案和概念,比如虚拟化存储和Infiniband。前者能够解决存储设备的异构问题,使得用户不必关心底层各种各样的存储设备,只需要虚拟化存储系统在后台解决系统的异构问题;Infiniband用来解决SAN的某些问题,是一种I/O总线技术。它将存储系统划分为Infiniband交换机、计算节点、I/O节点、存储节点,结构化的存储分层思想十分明显。不过由于只是在SAN之内解决问题,对存储系统的结构化没什么帮助。
2. 虚拟化存储
由于目前存储系统已经日益的复杂和庞大,管理的难度已经大大增加。为了简化存储设备的安装和配置,有效的利用不同厂家、不同型号的存储设备形成一个统一的存储设备,则必须采用虚拟化存储技术。
虚拟存储是介于物理存储设备和用户之间的一个中间层,它屏蔽了具体物理存储设备的物理特性,呈现给用户的是逻辑设备。它所带来的最大好处是提供了一种简单有效的管理手段:在已经建立好的存储池上,用户可以方便地划分虚拟存储空间,当需要增加新的物理存储设备时,用户无需停止服务来对整个存储系统进行重新配置,只需要对存储系统进行简单的配置更改,就可以使新的存储设备加入到存储系统中。
虚拟化存储技术其实在很多厂家的产品中已经得到应用。比如NAS产品将磁盘阵列的细节隐蔽起来而只向客户端提供一个网络硬盘设备就是一种虚拟存储的应用,只不过我们这里所说的虚拟存储的概念对于后端传输网络、物理存储设备的异构特点包容更好。
在典型的网络存储设备的结构中,包含了前端主机、后端存储设备以及连接前后端的网络。在这样的结构中我们可以在任意一层中实现虚拟存储,因此虚拟存储包括如下三种:基于服务器的虚拟存储、基于存储设备的虚拟存储以及基于网络的虚拟存储。
基于服务器的虚拟存储虚拟化层以软件模块的形式嵌入到应用服务器的操作系统中。基于服务器的虚拟存储有以下特点:
首先基于服务器的虚拟存储的应用环境主要针对是服务器数量较少且以服务器为中心的环境。
其次是基于服务器的虚拟存储由于虚拟软件运行在服务器上,其虚拟软件必然占用服务器的CPU、内存等资源来实现各种功能,给服务器带来额外开销。由于和服务器操作系统紧密相关,在存储系统的异构上面不可能做的很好。
再次就是由于不需要额外再添加任何硬件,也不影响现有的存储系统的架构,因此基于服务器的虚拟存储是最容易实现而且成本最低的。
基于存储设备的虚拟化是将虚拟化层放在存储设备的适配器或控制器上。基于存储设备的虚拟存储有如下特点:
首先基于存储设备的虚拟存储的应用环境主要针对异构存储设备,适用于以存储设备为中心的环境。
其次由于国际上没有统一标准,各家厂家对于存储设备的虚拟化基本上处于各自都有自己一套方法的状态,因此各厂家的产品很难在同一环境下整合,削弱了系统的灵活性。
再次由于在存储设备上实现的虚拟化,对用户和管理人员是透明的,使用管理起来比较方便。
3. 存储设备的进步——串行一统天下
随着磁盘和磁带技术的进步,基本存储设备也在发生巨大变化。随着服务器被要求满足不断提高的系统和应用需求,并行技术无法回避的各种问题,如信号终止限制,电缆和连接器的反射,信号扭曲和串音,以及设备寻址能力等问题都成为提高数据传输性能的障碍。串行协议能够解决生产厂家、集成厂商、用户的不少问题,因此就磁盘来说,串行接口将一统天下。
在普通ATA硬盘使用SATA串行接口技术之后,SCSI这个专用服务器硬盘接口协议也开始使用串行技术。串行SCSI的标准称为SAS(Serial Attached SCSI),SAS接口具有多种优势。最明显的优势是它在吞吐量方面比并行SCSI有了显著的改进(大致是后者的4倍)。SAS还使更多的硬盘可以连接在SCSI总线上:并行SCSI可在15个地址上连接设备,但是即使假设每个地址上连接多个逻辑设备(LUN),并行SCSI也不可能达到SAS提供的连接能力—通过扩展器可提供多达128个地址。另外SAS还可以在同一接口中兼容SATA和SCSI硬盘。目前业界普遍看好结合了SAS和SATA硬盘的系统,认为这是对目前FC硬盘的最大威胁,因为在大多数应用中SAS接口的系统就能够满足绝大部分的要求。
磁带是最老的存储设备,原来的备份领域完全是磁带的天下。但是随着各种磁盘存储系统的发展其市场份额却在缓慢减少。对于备份系统来说,磁带备份容量是无限的,而新型磁带的持续传输速率也是比磁盘高的,随着美国对于归档的法律要求,人们发现磁带在归档中是最适合的产品。磁带格式为LTO(Linear Tape-Open,线性磁带开放),其第四代产品Ultrium的容量达到800GB,传输速度能够达到80~160MB/s。
4. ILM(信息生命周期管理)
信息生命周期管理,顾名思义就是对信息的产生、使用到消亡这样一个完整的生命过程进行有效管理。在早期的存储管理系统中,所有的数据都被存储在企业的主存储器上,然而要存储的数据越来越多,不可能将所有的数据都存储在主存储器上;另外由于主存储器的价格越来越昂贵,比如SAN中的FC硬盘就相当昂贵,不可能将一些并不经常访问的数据也放在主存储器上。有的数据需要保留相当长时间,因此对存储介质的稳定性要求较高;有的数据需要经常访问,因此数据访问速度要快;而有的数据可能只是一些临时数据,因此需要系统能在它失去功效的时候自动将其删除。于是存储方面的技术专家开始从各种角度探讨什么样的数据采用怎样的存储设备最为合适,而要评估那些看上去毫无意义的数据的类型,则需要关注这些数据是如何产生的、它们在何时被何人调用、被调用的频繁程度如何、数据在何时不再有价值而需要彻底删除,从而最终实现数据类型的分析,赋予数据重要、不重要或经常访问、不经常访问等属性,全面地为所存数据制订完善的存储策略,并通过工具自动执行这些存储策略。
5. 存储网络的提速
数据存储现在的趋势是网络存储,数据之间的传输通道不再仅仅通过I/O接口,而还要通过交换网络,因此提高网络的传输速度就成为了提升数据存储速度的途径之一。
而在FC网络这边,目前主流的应用标准为2Gbps,而就在最近很多厂商推出新的4Gbps的产品,据厂家介绍对SAN的网络的提速也是比较明显。不过升级到4Gbps要升级相关设备。
本文只是大概介绍了存储系统的概念和一些最主要的发展,其实存储系统在很多方面都发生着变化,比如大规模非活动磁盘阵列、CAS、CDP等,在本文中不可能一一论述,这些新技术新概念推动着数据存储向着存储容量更大、存储速度更快、更容易使用的方向发展。
名词解释
在线存储
在线存储又称工作级的存储,存储设备和所存储的数据时刻保持“在线”状态,是可随意读取的,可满足计算平台对数据访问的速度要求。如我们PC机中常用的磁盘基本上都是采用这种存储形式的。一般在线存储设备为磁盘和磁盘阵列等磁盘设备,价格相对昂贵,但性能最好。
离线存储
离线存储主要是用于对在线存储的数据进行备份,以防范可能发生的数据灾难,因此又称备份级的存储。离线海量存储的典型产品就是磁带或磁带库,价格相对低廉。离线存储介质上的数据在读写时是顺序进行的。当需要读取数据时,需要把带子卷到头,再进行定位。当需要对已写入的数据进行修改时,所有的数据都需要全部进行改写。因此,离线海量存储的访问是慢速度、低效率的。
近线存储
所谓近线存储,就是指将那些并不是经常用到,或者说数据的访问量并不大的数据存放在性能较低的存储设备上。对这些的设备要求是寻址迅速、传输率高。因此,近线存储对性能要求相对来说并不高,但由于不常用的数据要占总数据量的大多数,这也就意味着近线存储设备首先要保证的是容量。
责编:
微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友