一个小站的自留地
AWS 公布 10 月 20 日重大故障原因:DynamoDB DNS 系统竞争条件导致 Amazon Web Services (AWS) 发布了 2025 年 10 月 19 日至 20 日 US-EAST-1 (弗吉尼亚北部) 区域重大服务中断的详细原因报告。此次中断的根本原因被确定为 Amazon DynamoDB 的 DNS 自动化管理系统中存在一个潜藏的竞争条件 (race condition)。 故障始于 10 月 19 日 23:48 PDT (太平洋夏令时间,北京时间 10 月 20…
Microsoft Azure 发生重大中断,官方称由配置错误引发

当地时间 2025 年 10 月 29 日,Microsoft (微软) 的 Azure 云服务遭遇全球性重大中断。根据 Azure 状态历史页面的初步事后审查 (PIR) 报告,此次中断开始于 10 月 29 日 15:45 UTC (协调世界时),并于 10 月 30 日 00:05 UTC 确认缓解,持续时间约 8.5 小时。

此次中断导致依赖 Azure Front Door (AFD) 服务的客户和 Microsoft 内部服务出现延迟、超时和错误。受影响的服务范围广泛,包括 Microsoft 365 (如 Outlook, Teams), Microsoft Entra ID, Azure 门户 (Azure Portal) , Azure SQL 数据库以及 Copilot 等。

微软将事故原因归咎于 Azure Front Door 内部的一次「意外的租户配置更改」。此更改引入了无效或不一致的配置状态,导致大量 AFD 节点无法正常加载。官方报告进一步指出,一个「软件缺陷 (software defect)」导致部署过程绕过了安全验证机制,从而引发了此次大规模中断。

微软通过阻止所有新的配置更改,并部署「上一个已知良好 (last known good)」的配置来恢复服务。

此次中断恰好发生在 Microsoft 公布其 2026 财年第一季度财报前几小时。

(综合媒体报道)
 
 
Back to Top