了解数据中心设备风险等级

来源: 博客
2012/10/16 17:10:11
任何一家企业都很担心自己会无故卷入数据中心系统宕机事件中。但是,我们往往会忽视一个现象——任意两个宕机事件的情况都不是完全相同的。数据中心瞬间的故障就可能会引发极其严重的后果。

分享到: 新浪微博 腾讯微博
本文关键字: 数据中心

任何一家企业都很担心自己会无故卷入数据中心系统宕机事件中。但是,我们往往会忽视一个现象——任意两个宕机事件的情况都不是完全相同的。数据中心瞬间的故障就可能会引发极其严重的后果。

鉴于此原因,对数据中心每台设备进行风险归类就显得至关重要,这要求我们对一家机构关乎其产业链薄弱环节的系统弱点有所了解。从广义上讲,HVAC和电力系统、设备安全、IT基础设施运维和操控及灾害防备等相关因素都应该被放在一起考虑,从而确保数据中心设备的可靠性。

我们可以使用风险等级的概念来对企业核心设施进行可用性和可靠性评估,这无论是对现有设备来说还是对新设施的设计进程来说都是有用的。它可以帮助我们为核心任务选择合适的部件,从而起到防止数据中心宕机的作用。

以下是一个对设备进行风险等级评定的例子:

C1——指那些支持本地日常办公进程、不会进行日常备份的设施。这些设施的瘫痪可能会导致生产力的下降。但是,在经历突发宕机事件后,我们可以在短时间内轻松将其恢复。

C2——指那些支持本地和远程核心业务进程的设施。C2设施的宕机会对生产力产生广泛的影响。在发生突发宕机事件后,要对其进行全面恢复可能会花数小时时间。对这些设施的停机检修是要被排进日常工作流程当中的。

C3——指支持和/或包括核心业务进程的备用设施。这些设施的失效会对生产力产生重大影响并会直接影响到客户的使用。在发生突发宕机事故后,要对其进行全面恢复药花几小时甚至几天时间。每个几个月或每个季度都要挑选低风险时段对这些设备进行日常维护。

C4——指那些支持和/或包括核心业务进程的主要设施。这些设施的失效会对生产力产生重大影响并会直接影响到客户的使用。在发生突发宕机事件后,要花几小时甚至几天时间才能将其修复。每个月或在每个季度都要挑选中等风险时刻对这些设施进行在线维护。要想对其进行停机维修是很难的。

C5——指那些支持和/或包括核心业务进程的主要设施。这些设施的瘫痪会直接导致系统的瘫痪。在发生突发宕机事件后,要花几天甚至几周时间才能将其修复。每个季度或每年都要挑选中等风险时刻对这些设施进行在线维护。要想对其进行停机维修是很难的。

C6——指那些支持和/或包括核心业务进程的大型数据中心,通常是指一个包括多个远程数据中心在内的网络。这些设施的宕机影响极为广泛,可能会影响到国家安全和公共安全。经历宕机事件后,所有的维修措施都必须在线执行,并力图将风险降至最低,这一过程可能会花几周甚至几个月的时间。

C7及C7以上——指核心设备持续增长或演变后的等级。

这种风险等级评定方法使设施规划人员和IT主管可以对各种设备部件的重要性等级和质量要求进行评估,获取备用电源、安全性、IT配置和IT冗余性等指标是这一方法的终极目标。例如,大型数据中心内一套风险等级为C6的设施的IT冗余性肯定要比支持办公进程的C1设备要高的多。

当设施设计规划人员掌握这些风险等级之后,再结合外部运营不尽啊的评估,他们就能提供相应的业务灵活性、冗余度及安全性来为相关机构的关键业务提供支持。

责编:赵龙
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
IT系统一体化时代来了

2009年Oracle 用Exadata服务器告诉企业,数据中心的IT服务一体化解决方案才是大势所趋,而当前企业对大数据处理的..

高性能计算——企业未来发展的必备..

“天河二号”问鼎最新全球超级计算机500强,更新的Linpack值让世界认识到了“中国速度”。但超算不能只停留于追求..

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map