北京时间 2024 年 9 月 10 日 10:20,阿里云监控发现新加坡地域可用区 C 出现网络访问异常,部分云产品服务因此中断。根据阿里云发布的公告,此次事故由新加坡机房内锂电池爆炸引发火灾,导致机房温度急剧升高。目前,消防人员已抵达现场进行处理,但由于火情复杂,部分云产品的恢复工作仍在进行中。
阿里云健康看板显示,目前新加坡区域仍有服务未恢复。官方最后一则故障更新来自 11 日凌晨01:46,称接当地消防要求,因消防浇水持续进行,机房开始出现积水和渗漏,电路存在短路风险,新加坡可用区C 一栋机房大楼整体紧急断电,可用区C其他大楼业务网络已陆续恢复。
本频查证后发现,阿里云在新加坡有三个数据中心,起火的为其中一个。新加坡本地媒体报道,失火的是位于罗央大道的Digital Realty数据中心,有人听到爆炸声后,见到数据中心冒起浓烟。
此次事故暂时未报告人员伤亡。阿里云新加坡地域可用区 C 部分服务截至发稿仍未恢复。
(阿里云,视频:8world News)
——————
进展更新:
11 日凌晨,大部分受到网络影响的云产品已恢复正常服务。剩余断电的机房业务仍需等待物理条件的恢复。
11 日晚 20:23,消防部门仍在处理大楼现场风险中,运维工程师正在等待获准进入机房大楼。如现场评估后不具备原地恢复的物理条件,应急小组将执行服务器设备迁移恢复预案。
12日17:25,阿里云运维人员已获准进入大楼一层区域,正在现场评估安全迁移条件,并对硬件设备进行紧急保全。
13日18:30,一层硬件设备正在安全迁移进行中。运维人员已获准进入二楼,完成勘查工作,在保全工作后将启动二层机器设备的安全迁移。
14日19:00,已迁移完成的部分机器设备正在进行必要的上架准备工作,包括机器干燥、布线、上电、验证、调试等。
16日14:00,机器设备的安全迁移工作仍在稳定推进中,剩余受影响的云产品服务正在陆续恢复。由于部分机器仍处于危楼封锁区域无法进入,一些机器设备需要仔细干燥以确保数据安全,因此长尾机器的恢复可能持续较长时间。