【kaiyun体育官方人口 原创】随着信息系统日益成为支撑企业运转的核心要素,以及企业服务意识的增强,中国的企业管理者对于灾难备份的重视程度也在不断提高。不过,灾难备份专业性很强,一些企业的信息主管,包括企业管理者对灾难备份的认识仍然有大量误区,导致企业在灾备建设方面花费不少,效果却不佳。
企业的数据中心经常面临哪些威胁?怎样才能建立一个有效的、投入合理的灾难备份系统?日前,kaiyun体育官方人口 采访了美国飞康软件公司中国区技术总监颜军,让他来为企业解开疑惑。
美国飞康软件公司中国区技术总监颜军
企业经常面临哪些真实的威胁
企业数据中心经常面临哪些真实的、高概率的威胁呢?我们谈到容灾备份,常常把灾难想当然地与火灾、水灾、地震等自然灾害联系在一起。颜军认为,这些灾害对用户来讲仅仅是灾难的一个方面,并不是灾难备份所要防御的重点目标。那么哪些威胁是需要企业重点防御的呢?
在国家标准中,灾难的定义是指由于人为或自然的原因,造成信息系统严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受、达到指定时间的突发事件。在这个定义里面,并没强调灾难是因为自然的原因还是黑客的原因引起的,而是说任何原因都能够引发应用系统和业务停止运行,在短时间内不称其为灾难,超过了指定时间之后,就称为灾难。
灾难可分成三大类:灾害、严重故障、一般故障。这里面讲的灾害就是指传统意义上的火灾、地震等;严重故障一般指数据库瘫痪、存储设备损坏等,主要指设备的故障;一般故障指人为攻击、人为数据删除等。“在这三大类灾难里面,灾害发生率只占到3%,严重故障和一般故障占到97%,而这里面一般故障与严重故障之比为6:4,严重故障和一般故障占到了灾难发生率的很大比例。”颜军说。
在数据中心比较多的一线城市,灾害发生的机率非常小。企业灾备系统不应该只做好针对灾害的防御就高枕无忧了,而是要能够有效防御高发的严重故障和一般故障。事实上,很多企业的灾备系统都只是针对发生率仅为3%的灾害的,大量的灾备厂商的技术也只针对灾害。而当企业的信息系统发生故障时,企业如果没有针对这类故障而设置的灾备系统和快速反应机制,很可能会发生严重的数据丢失事件,这对企业自身的业务运行和用户体验都有非常大的负面影响。
企业如何有效应对灾难
我们知道,无论是灾害、严重故障或是一般故障,事情的起因不分大小,如果不具备防御能力,给企业造成的后果却可能相同。所以企业必须对任何导致灾难的诱因都要予以防范,否则小事情也能够引发大灾难。最典型的例子就是2010年2月3日下午,国内某大型银行出现长达4小时的系统故障,其间柜台业务、网上银行、电话银行各项业务均不能办理。颜军说:“当时该银行的数据库没有任何物理上的损害:既没有着火,也没有停电,而是源自于数据库在一定压力下的一种表现。”虽然该行有灾备系统,但最终“没敢切换”。
在企业实际的灾备实践中,有一个奇怪的现象,就是在灾难发生的时候,很少有企业敢把产生数据切到灾备中心。当然,之所以有些企业在数据中心发生故障时不敢启动灾备系统,不排除其灾备系统仅仅是一个虚架子,灾难发生的时候,灾备系统无法恢复数据,信息部门不愿意捅破这层窗户纸。而更深层次原因在于,即便是企业具有完备的灾难备份系统,信息部门也不愿意切换,因为这样做影响面大、风险高。
在企业的灾备流程中有明确规定:数据切换到灾备中心需要企业一把手签字,这就意味着信息主管需要写申请、等待领导小组讨论审批,影响的范围扩大了,事件处理的时间也延长了。同时,数据中心恢复正常了,在从灾备中心向数据中心导入数据的时候,很有可能会发生数据丢失等意外的错误,而且备份回来需要多长时间也不能预测。尤其在利用磁带恢复数据的时候,如果磁带在某个地方断了,那么之前复制的所有数据都会全部丢失,这时信息主管的厄运就来了--现场被覆盖了,无法逆转。因此很多信息主管在系统发生故障的时候都会在现场自己修复,或者让灾备厂商的专业人员来现场进行恢复。
由此可见,灾难备份并不是简单的数据复制,更重要的是数据复制之外的东西——克服错误。那么怎样才能让企业无需切换到灾备中心,在现场就能解决问题呢?这就要求灾备系统既要具有对灾害防御的能力,又要有克服错误的能力。要做到这一点,灾备系统必须要有复制和历史恢复的能力。颜军对kaiyun体育官方人口 说:“飞康的系统既能够进行数据复制,同时在本地和异地都有历史轨迹保存技术,在生产和灾备端都能找到历史轨迹。”说得更形象一点,就如同银行的监控系统能够保存现场的轨迹。比如在监控录像中我们只需要用鼠标拉到某一时间点上,就可以找到某一时间点的现场。
责编:陈慧
微信扫一扫实时了解行业动态
微信扫一扫分享本文给好友