|
宕机之殇:2012年数据中心事故总览
尽管投入各种高新复杂技术,尽管投入海量巨资,云计算还是显得有些脆弱,在过去的几年里不乏动辄就宕机数小时的事件,甚至有的长达一天或数天,并导致数据丢失。
尽管投入各种高新复杂技术,尽管投入海量巨资,云计算还是显得有些脆弱,在过去的几年里不乏动辄就宕机数小时的事件,甚至有的长达一天或数天,并导致数据丢失。 以下是本年度云服务宕机事件一览: 微软Azure 2012年,云服务的中断屡屡让提供商们尴尬不已,Thinkstrategies创始人Jeff Kaplan给了一些关于云计算的永不过时的简单建议。 2月28日,由于“闰年bug”导致微软Azure在全球范围内大面积服务中断,中断时间超过24小时。 微软表示该软件BUG是由于闰年时间计算不正确导致。 这一事件激起了许多用户的强烈反应,许多人要求微软为此做出更合理详细的解释。 亚马逊AWS 6月15日,亚马逊北维吉尼亚的数据中心遭遇停电,由此导致亚马逊网络服务AWS中断约6个小时,影响波及亚马逊弹性计算EC2、亚马逊关系数据库服务以及亚马逊弹性魔豆AWS Elastic Beanstalk。 北维吉尼亚数据中心是亚马逊使用最久的数据中心,在2011年以及今年10月都曾发生过宕机事故,导致用户信心流失不少。 对于亚马逊的有些合作伙伴来说,这种状况往往会拖后腿。 “我很喜欢亚马逊,但是宕机的时候也真是无能为力,尽管我也知道传统IT数据中心也会遇到这种情况”,Stratalux公司CEO Jeremy说。中断事故导致了他的一位客户服务中断了1个小时。 微软Windows Azure再次宕机 7月26日,Azure故障,导致西欧用户受影响。微软对故障的解释是“由于错误配置了网络设备导致了西欧区域的服务网络中断”。 此次中断持续2.5小时。微软表示此次事故中并无用户数据丢失。 Google Talk 在微软Azure宕机的同一天,Google Gmail用户使用的Gtalk中断了近5小时。 Gtalk服务的控制面板页为用户提供了因服务中断所导致的升级。Google对此也做出了道歉“请相信google是极度重视系统可靠性的,我们会更加注意提升我们系统的性能”。 GoDaddy 9月11日,网络托管和电子邮件服务提供商GoDaddy遭遇6小时服务中断,原因是网络故障,起先怀疑是著名黑客组织Anonymous所为,但该组织予以了否认。 该公司称中断的原因是由于内部网络故障导致路由表错误。 在10月上旬,GoDaddy宣布他们计划关闭其云服务业务,其SMB将会整合到其他服务里。 又是亚马逊AWS 10月22日,位于北维吉尼亚的亚马逊网络服务AWS又挂了,影响了包括Reddit、Pinterest等知名大网站。 中断影响了弹性魔豆服务,其后是弹性魔豆服务的控制台,关系数据库服务,弹性缓存,弹性计算云EC2,以及云搜索。 这次事故让很多人认为,亚马逊是应该升级其北维尼吉亚数据中心的基础设施了。 Google App Engine GAE是用于开发和托管WEB应用程序的平台,数据中心由google管理,中断时间是10月26日,持续4小时,因为突然变得反应缓慢,而且出错。受此影响,50%的GAE请求均失败。 google表示没有数据丢失,应用程序行为也有备份可以还原。为表歉意,google宣布11月份用户可以 google表示他们正在加强其网络服务以应对网络延迟问题,“我们已经增强了流量路由能力,并调整了配置,这些将会有效防止此类问题再次发生”。 在google服务故障的当天,Dropbox和Tumblr也发生了服务中断。不过并未找到三者之间存在的关系。 Tumblr GAE中断的当天,著名微博客平台和社交网站Tumblr也发生故障。几小时后修复,该公司也称将会发布详细的事故报告。 但此后他们尚未做出进一步的解释。 Dropbox 10月26日,在线存储公司Dropbox也发生服务中断。 当时网站显示错误信息“抱歉,网站出问题了,不过请勿担心,数据都很安全,我们也在尽快修复。” 此后他们也并未做出进一步的解释。
责编:chrislee2012
微信扫一扫实时了解行业动态
微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
|
最新专题
推荐圈子
|
|