首页 >> 公司简介 >> 新闻中心 >> 全球数据中心2010年宕机事件
全球数据中心2010年宕机事件
《重庆冠旭科技有限责任公司》 www.guanxu.com 版权所有 严禁复制 更新于:2011-2-22


全球数据中心2010年宕机事件大盘点

  12月13日早间消息,亚马逊旗下英国、法国、德国和西班牙网站周日晚间宕机超过一个半小时,但目前还没有迹象显示这与网络攻击有关。自从维基解密开始公布美国机密外交电文后,亚马逊是首批宣布与维基解密断绝业务的公司之一。随后一批支持维基解密的网络黑客对亚马逊网站发起了网络攻击。

  闪电、风暴、洪水、转换开关的失误都是今年数据中心停电的罪魁祸首,大量的社会媒体网站,如Twitter、Facebook以及一些免费托管的服务器群都有严重的断电现象。在2010年,主要电子商务商服务的服务器就出现了四次严重断电,导致数百万美元的交易流产,甚至连政府服务网站也出现宕机事件。

  12月13日 亚马逊欧洲四国网站宕机

  12月13日早间消息,亚马逊旗下英国、法国、德国和西班牙网站周日晚间宕机超过一个半小时,但目前还没有迹象显示这与网络攻击有关。自从维基解密开始公布美国机密外交电文后,亚马逊是首批宣布与维基解密断绝业务的公司之一。随后一批支持维基解密的网络黑客对亚马逊网站发起了网络攻击。

  亚马逊旗下英国、德国、法国以及西班牙网站均出现了时间超过30分钟的宕机,直至格林威治时间周日21:45逐步恢复正常。亚马逊美国网站此次并未遭受影响。亚马逊公司目前尚未对此发表评论。支持维基解密的黑客也没有通过微博客网站Twitter发表声明,宣布对亚马逊欧洲网站宕机一事负责。

  11月4日科斯iWeb用户因转换开关故障无法使用

  iWeb的CL数据中心因火灾迫使3000台虚拟服务器主机转用发电机设备进行供电,其中三台发电机正常启动,另外一台因转换开关故障而启动失败。一旦UPS电源被耗尽,该数据中心将有三分之一的设备宕机。

  大约一小时后电力恢复,但至少有450台的服务器没有重新启动,需要进行人工操作,一直持续到4日的下午4点所有的服务器才开始正常运行。通过这一事件,iWeb在博客中表示,该公司每星期都会对备用电力设备进行测试,防止同类情况发生。

  10月29日全球最大的支付平台PayPal断电导致数据记录错误

  因断电导致的PayPal支付系统网络硬件故障,使数百万商户在网上的交易无法进行处理。网络硬件故障使这些无法进行交易的数据转移到了另外一个数据中心,这也造成了eBay支付服务系统90分钟的宕机。

  事故发生在10月29日上午8点7分,全世界的PayPal用户都遭遇了无法进行操作的处境,但是PayPal首席技术官斯科特吉尔福伊尔在博客上表示,问题出现时,无法及时切换至备份系统,加PayPal之前的数据中心只是托管在一个服务商那里,所以将数据转移到eBay在丹佛的“Topaz”数据中心这个过程花费了一些时间。

  该公司表示,全球9000万PayPal常规现时用户平均每秒钟进行的转账资金高达2700美元。根据彭博社的统计,按照这一数字计算,在宕机的一个半小时里,全球有1460万美元的现金转账交易因此受到影响。

  9月16日网上银行门户网站Chase.com重新上线遭遇停电宕机

  9月16日,网上银行门户网站Chase.com宣称在遭遇了周二和周三漫长的停电危机后,重新上线,冗长的等待过程导致了定期支付账单无法按时交易。

  该网站负责人想华尔街日报透露,9月13日晚托管在第三方数据中心的数据库软件在登录过程中被损坏,但是,客户的数据相对安全,并且各地的ATM机及电话银行都在紧急恢复中。长时间的停机,网上银行客户账单逾期支付成了突出问题,该网上银行门户网站表示,9月15日晚才对这一事故进行了处理,将退客户还在此期间产生的的滞纳金,并对此事件进行公开道歉。

  8月27日弗吉尼亚霍伯尔计算机停机服务

  8月27日,周四,切斯特菲尔德国家数据中心计算机故障导致了弗吉尼亚州多台关键服务器瘫痪,弗吉尼亚州官员透露。据媒体报道,此次故障至少导致了220台服务器宕机,致使24个州失去了充分的IT支持。

  驱动程序及应用程序的故障导严重影响了政府的日常工作,包括政府援助贫困家庭女子抚养费的计划和失业者的福利申请。弗吉尼亚州信息技术局负责人说:“如此规模的停电宕机,让我们措手不及,不过有些时候,不管你怎么做,这类情况都会发生。”

  尽管话这么说,但势必要尽快对IT基础设施的状态进行检测。通过存储供应商的技术人员对故障设备的检查,此次的宕机时间似乎是存储区域网络硬盘的故障,但负责人表示国际计算机数据是完好无损的。

  值得思考的是,在去年秋天新闻媒体报道了弗吉尼亚州的一次停电事故后,并未引起当地政府的注意,每年数亿的外包合同仍由诺斯罗普格鲁门公司获得。

  6月16日 knocked Intuit网站宕机超过24小时

  knocked Intuit网站出现了超过24小时的脱机,该公司表示,其故障是由于头天晚上进行电源日常维护时发生的。此宕机事件影响了数千个在该网站进行托管的小企业客户。该公司首席信息官GinnyLee说,这一以外的断电事故影响了我们的数据备份系统,因此采取了离线服务。直到24小时后网站才恢复正常,在此期间,大部分进行托管的小型企业客户都无法登录网站并进行交易。对他们来说这是漫长的一天,也是煎熬的一天。

  6月29日亚马孙大范围宕机数小时 每分钟损失5万美元

  据外媒报道,当地时间6月29日,亚马逊网站出现大范围宕机,在超过3个小时的时间里,很多用户只能浏览到空白或部分页面。到周二中午,亚马逊主页上的所有产品图片都无法显示,只能显示左侧的类别列表。搜索功能基本都无法使用,而购物车和用户保存的产品列表也曾出现空白的情况。

  亚马逊的年收入约为270亿美元,一旦网站宕机,平均每分钟将面临5.14万美元的损失。截至29日下午5点,该网站已恢复正常。该公司此前几次宕机分别发生在2008年(90分钟)、2006年(1小时)、1999年(30分钟)。本次宕机并未影响到亚马逊网络服务,控制界面显示该服务一直运行正常。

  6月1日达拉斯数据中心被淹 断网长达3天

  达拉斯一数据中心因水管破裂被淹导致达拉斯县IT系统断网超过3天时间。在达拉斯的档案大楼里,UPS系统和其他电气配套设备在数据中心大楼的地下室里,尽管被警告有数据中断的危险,但是并没有采取任何备份措施。

  当地时间6月1日晚上10:30左右,因水管爆裂导致地下室水深六英尺,迫使数据中心关闭。即使出动了全达拉斯的抽水机花费了数天,直到4日早上还是没有恢复运行。因为这里的水混合着油和泥,抽不出来,只能让卡车进入下水道系统进行油泥的清除,这一过程相当缓慢。

  关于数据备份的建议早在2008年便被提出,但是从未被通过。目前,IT人员正在开发数据转移计划。就此时间,达拉斯当地政府负责人表示没有重要数据丢失,已经确认了服务器完好无损。

  5月11日汽车撞到高压电线杆 导致Amazon数据中心停电

  当地时间5月11日,Amazon云计算服务因停电事故出现故障,致使美国东部的少量用户失去服务长达一个小时。

  这次事故的原因,是一辆汽车撞倒了Amazon数据中心附近的高压电线杆,而数据中心的配电开关又未能正常地从公用电网切换到内部的备用发电机(配电自动化系统错误地将停电原因理解为电气接地)。

  值得注意的是,这是Amazon云计算服务一周内第四次因停电发生故障。5月8日的故障(因配电屏电气接地和短路)曾导致部分用户失去服务长达7个小时,而且还导致极少量用户的数据丢失。而5月4日的两次故障的原因则分别是一个UPS单元故障和人为操作失误。

  在上几次故障之后,Amazon发布报告,表示它正在研究改变数据中心的配电架构,以减少此类事件的发生。它也同时提醒用户,可以在多个可用性区域部署实例,以防范此类事故。Amazon还提供了AmazonCloudWatch和AutoScaling供用户快速从事故中恢复。

  5月6日美股巨幅震荡 导致部分财经投资网站崩溃

  据国外网站报道,当地时间5月6日,周四,美股的大跌也使一些财经网站不堪重负,因为很多人都急于在线交易或核实投资。雅虎财经、谷歌财经和Fidelity.com(富达投资)期间都出现无法访问或速度很慢的情况。

  雅虎女发言人表示,雅虎财经出现了间歇性的问题。谷歌在这一时期也出现了错误,并进行数据恢复。

  美国当地时间5月6日下午,道琼斯工业指数曾一度跌了1000点,据悉可能是大型高速计算机可能带来错误的交易,这不仅引起了市场的混乱,还导致了部分服务器瞬间宕机。

  3月31日洪水无情 冲垮英国电信服务

  英国电信设在伦敦帕丁顿的网络中心由于收到洪水的袭击,造成了大范围停机,并且带有严重的连锁反映,也影响了电信服务和客户支付。该公司当时表示,可能是由于电路遭到了故障或者损坏,因为电路遍布建筑物内部,所以修复起来工程庞大,且需耗时数日。

  事故发生后,英国电信调用了两台发电机,在洪水清楚后进行及时安装调试。此次洪水让数以千计的客户遭到了宽带以及电话服务的损失,还有可能涉网络支付业务。


我对此有兴趣 打印此页 返回顶部 【关闭窗口】