据外媒报道,亚马逊云端服务Amazon Web Services(AWS)25日遭遇了持续数小时的故障,导致部分网站和服务系统崩溃。
AWS的服务状态页面上的通知显示,因其处理大量数据流的服务器Kinesis出现问题,导致一些网站的“错误率增加”,亚马逊已经对该问题进行了修复,但完全恢复还需要一段时间,并贴出了当前受到影响的服务。
该故障主要影响美国东部地区的服务,目前,AWS亚太区暂未受到波及。
最新更新(太平洋标准时间下午6:23):我们想提供一个关于影响美国东部1区内Kinesis数据流API和其他相关服务的问题的更新。我们现在已经减轻了对Kinesis中负责处理传入请求的子系统的影响,不再看到错误率或延迟的增加。但是,我们还没有完全承担流量负载,正在努力放宽对服务的请求限制。在接下来的几个小时里,我们希望将这些节流阀放宽到以前的水平。我们预计,随着这一时间段的结束,客户将开始恢复。
美国东部1号地区的CloudWatch指标仍处于延迟状态。一旦我们将Kinesis的限制恢复到以前的水平,我们将恢复CloudWatch度量功能。我们希望在那个阶段看到CloudWatch度量的恢复,以获得新的度量,但是度量完全复原可能需要更长的时间。
我们将继续向您通报我们的最新进展。
据AWS称,这次宕机仅影响亚马逊23个地理AWS区域之一,但这个问题已经严重到影响到了大量互联网公司的服务。
许多公司在推特上吐槽有关AWS中断如何影响它们的信息。
包括1Password、Acorns、Adobe Spark、Anchor、Autodesk、Capital Gazette、Coinbase、DataCamp、Getaround、Glassdoor、Flick、iRobot、《费城问讯报》、Pocket、RadioLab、Roku、RSS播客、《坦帕湾时报》、Vonage、《华盛顿邮报》和纽约公共广播电台(WNYC)。专门监测网络状况的网站Downdetector.com也显示,全天许多用户纷纷反映亚马逊的不少服务出现了问题。
值得一提的是,正值北美“黑色星期五”前夕,AWS宕机可能影响到亚马逊的电商业务。有卖家称,其亚马逊上的订单数据突然急剧下降,甚至广告费用也出现了异常。
AWS是世界上使用最广泛的云计算服务之一,因此,任何问题都可能对其他Web服务和应用程序产生严重的连锁反应,这一点可以从受今天宕机影响的公司数量中看出。
此前,AWS云存储服务S3也曾在2017年出现大宕机,该错误持续了4个小时,彼时AWS解释称该故障是由于一名程序员在调试系统的时候,运行了一条原本打算删除少量服务器的脚本,结果输错了一个字母,导致大量服务器被删。被错误移除的服务其中运行着两套S3的子系统,从而导致S3不能正常工作,S3 API处于不可用状态。
雷锋网雷锋网雷锋网