Google DeepMind CEO Demis Hassabis 于 11 月 19 日宣布正式发布 Gemini 3 系列模型。
作为 Google 目前最智能的模型,Gemini 3 Pro 现已推出预览版,其在 LMArena 排行榜上以 1501 Elo 的高分位居榜首,并在 Humanity’s Last Exam(37.5%)、GPQA Diamond(91.9%)以及数学基准测试 MathArena Apex(23.4%)中刷新了行业记录。
此次更新重点强化了推理与多模态能力。Gemini 3 具备 100 万词元(Token)的上下文窗口,支持对文本、图像、音视频及代码的深度理解与生成。Google 同时预告了 Gemini 3 Deep Think 模式,该模式在推理能力上更进一步,在 ARC-AGI-2 测试中取得了 45.1% 的成绩,计划于未来几周向 Google AI Ultra 订阅用户开放。
目前,Gemini 3 已集成至 Google 搜索的 AI 模式、Gemini App、AI Studio 及 Vertex AI 中。
(Google Blog)
据 Cloudflare System Status 页面显示,协调世界时(UTC)2025 年 11 月 18 日 11 时 48 分(北京时间 19 时 48 分),Cloudflare 遭遇内部服务降级,导致全球范围内的部分服务出现间歇性中断。
经过排查,官方确认了故障原因并开始实施修复。在此过程中,为了缓解问题,官方曾短暂禁用伦敦地区的 WARP 访问权限。截至 UTC 13 时 13 分(北京时间 21 时 13 分),Cloudflare Access 和 WARP 的服务功能已恢复,错误率降至事故前水平,伦敦地区的 WARP 访问也已重新开启。目前官方团队仍在继续开展修复工作,以完全恢复应用层面的服务,在此期间用户仍可能观察到高于正常水平的错误率。
(Cloudflare System Status)
xAI 发布 Grok 4.1 系列模型及 Agent Tools API
xAI 于近日正式发布 Grok 4.1 系列模型及其配套开发工具。其中,Grok 4.1 主模型在 LMArena 排行榜上以 quasarflux(推理模式)和 tensor(非推理模式)的代号包揽前两名,其推理模式 Elo 分数达到 1483 分,超越了 Gemini 2.5 Pro 和 Claude Sonnet 4.5 等竞争对手。该模型重点提升了创意写作、情感交互及协作能力,并在 EQ-Bench 等情商测试中表现优异。
同期发布的 Grok 4.1 Fast 专为工具调用和代理任务设计,拥有 200 万 token 的上下文窗口,并在多轮对话和长文本处理上进行了优化。配合新推出的 Agent Tools API,开发者可让模型直接调用 X 平台搜索、网页浏览、代码执行及文件检索等功能,无需自行维护检索管道。目前,Grok 4.1 Fast 模型及 Agent Tools API 已在 OpenRouter 平台上开启限时免费试用,截止日期为 12 月 3 日。
(xAI)
xAI 于近日正式发布 Grok 4.1 系列模型及其配套开发工具。其中,Grok 4.1 主模型在 LMArena 排行榜上以 quasarflux(推理模式)和 tensor(非推理模式)的代号包揽前两名,其推理模式 Elo 分数达到 1483 分,超越了 Gemini 2.5 Pro 和 Claude Sonnet 4.5 等竞争对手。该模型重点提升了创意写作、情感交互及协作能力,并在 EQ-Bench 等情商测试中表现优异。
同期发布的 Grok 4.1 Fast 专为工具调用和代理任务设计,拥有 200 万 token 的上下文窗口,并在多轮对话和长文本处理上进行了优化。配合新推出的 Agent Tools API,开发者可让模型直接调用 X 平台搜索、网页浏览、代码执行及文件检索等功能,无需自行维护检索管道。目前,Grok 4.1 Fast 模型及 Agent Tools API 已在 OpenRouter 平台上开启限时免费试用,截止日期为 12 月 3 日。
(xAI)
Google 预计将于近期同步推出 Gemini 3 系列与 Nano Banana Pro。有网友于 Google Vids 宣传物料上见到了 Nano Banana Pro 模型的字样。
预测市场 Polymarket 上,自 11 月 15 日起,Gemini 3.0 发布时间的预测大量倒向 11 月 18 日(周二),目前已有近 80% 概率。
预测市场 Polymarket 上,自 11 月 15 日起,Gemini 3.0 发布时间的预测大量倒向 11 月 18 日(周二),目前已有近 80% 概率。
小道消息,未经证实
OpenAI 发布了 GPT-5.1 系列模型。
GPT-5.1 Instant :最常用的模型,语气更亲切、更智能,更善于遵循指令。
GPT-5.1 Thinking :先进的推理模型,更易于理解,处理简单任务速度更快,处理复杂任务更具持久力。
GPT-5.1 Pro:即将上线
本周晚些时候,这两款模型也会登陆API。其中,GPT-5.1 Thinking将会以「GPT-5.1」的名称发布,而GPT-5.1 Instant则是「gpt-5.1-chat-latest」,两者均具备自适应推理能力。
GPT-5.1 Instant :最常用的模型,语气更亲切、更智能,更善于遵循指令。
GPT-5.1 Thinking :先进的推理模型,更易于理解,处理简单任务速度更快,处理复杂任务更具持久力。
GPT-5.1 Pro:即将上线
本周晚些时候,这两款模型也会登陆API。其中,GPT-5.1 Thinking将会以「GPT-5.1」的名称发布,而GPT-5.1 Instant则是「gpt-5.1-chat-latest」,两者均具备自适应推理能力。
OpenAI 还宣布,受益于 GPU 利用率提高,为其 Plus 订阅用户的 Codex 配额提高 50%。
Anthropic 宣布推出 Claude Code 的原生安装程序。
相比使用 NPM 安装,原生安装程序更简单、更稳定,并且不再需要 Node.js。这是 macOS、Linux 和 Windows 上安装 Claude Code 的最新推荐方式。
——————
Homebrew (macOS, Linux):
macOS, Linux, WSL:
Windows PowerShell:
Windows CMD:
相比使用 NPM 安装,原生安装程序更简单、更稳定,并且不再需要 Node.js。这是 macOS、Linux 和 Windows 上安装 Claude Code 的最新推荐方式。
——————
Homebrew (macOS, Linux):
brew install --cask claude-codemacOS, Linux, WSL:
curl -fsSL https://claude.ai/install.sh | bashWindows PowerShell:
irm https://claude.ai/install.ps1 | iexWindows CMD:
curl -fsSL https://claude.ai/install.cmd -o install.cmd && install.cmd && del install.cmdMicrosoft Azure 发生重大中断,官方称由配置错误引发
当地时间 2025 年 10 月 29 日,Microsoft (微软) 的 Azure 云服务遭遇全球性重大中断。根据 Azure 状态历史页面的初步事后审查 (PIR) 报告,此次中断开始于 10 月 29 日 15:45 UTC (协调世界时),并于 10 月 30 日 00:05 UTC 确认缓解,持续时间约 8.5 小时。
此次中断导致依赖 Azure Front Door (AFD) 服务的客户和 Microsoft 内部服务出现延迟、超时和错误。受影响的服务范围广泛,包括 Microsoft 365 (如 Outlook, Teams), Microsoft Entra ID, Azure 门户 (Azure Portal) , Azure SQL 数据库以及 Copilot 等。
微软将事故原因归咎于 Azure Front Door 内部的一次「意外的租户配置更改」。此更改引入了无效或不一致的配置状态,导致大量 AFD 节点无法正常加载。官方报告进一步指出,一个「软件缺陷 (software defect)」导致部署过程绕过了安全验证机制,从而引发了此次大规模中断。
微软通过阻止所有新的配置更改,并部署「上一个已知良好 (last known good)」的配置来恢复服务。
此次中断恰好发生在 Microsoft 公布其 2026 财年第一季度财报前几小时。
(综合媒体报道)
当地时间 2025 年 10 月 29 日,Microsoft (微软) 的 Azure 云服务遭遇全球性重大中断。根据 Azure 状态历史页面的初步事后审查 (PIR) 报告,此次中断开始于 10 月 29 日 15:45 UTC (协调世界时),并于 10 月 30 日 00:05 UTC 确认缓解,持续时间约 8.5 小时。
此次中断导致依赖 Azure Front Door (AFD) 服务的客户和 Microsoft 内部服务出现延迟、超时和错误。受影响的服务范围广泛,包括 Microsoft 365 (如 Outlook, Teams), Microsoft Entra ID, Azure 门户 (Azure Portal) , Azure SQL 数据库以及 Copilot 等。
微软将事故原因归咎于 Azure Front Door 内部的一次「意外的租户配置更改」。此更改引入了无效或不一致的配置状态,导致大量 AFD 节点无法正常加载。官方报告进一步指出,一个「软件缺陷 (software defect)」导致部署过程绕过了安全验证机制,从而引发了此次大规模中断。
微软通过阻止所有新的配置更改,并部署「上一个已知良好 (last known good)」的配置来恢复服务。
此次中断恰好发生在 Microsoft 公布其 2026 财年第一季度财报前几小时。
(综合媒体报道)
AI 代码编辑器 Cursor 发布了 2.0 正式版。主要更新内容包括:
- 多代理并行:编辑器侧边栏管理多个代理和编码计划,单次提示可同时运行最多 8 个代理,避免文件冲突,每个代理独立工作区。
- Composer 新模型:首次发布的智能 agent 编码模型,速度是同类模型的 4 倍。
- 浏览器功能 (GA):浏览器 agent 正式上线,可嵌入编辑器,支持元素选择与 DOM 信息、企业团队功能增强。
- 代码审查优化:跨文件查看代理变更更加简便,无需频繁跳转文件。
- 沙盒终端 (GA):macOS 下代理命令默认沙盒隔离,确保安全,仅读写工作区,无网络访问。
(Cursor)
- 多代理并行:编辑器侧边栏管理多个代理和编码计划,单次提示可同时运行最多 8 个代理,避免文件冲突,每个代理独立工作区。
- Composer 新模型:首次发布的智能 agent 编码模型,速度是同类模型的 4 倍。
- 浏览器功能 (GA):浏览器 agent 正式上线,可嵌入编辑器,支持元素选择与 DOM 信息、企业团队功能增强。
- 代码审查优化:跨文件查看代理变更更加简便,无需频繁跳转文件。
- 沙盒终端 (GA):macOS 下代理命令默认沙盒隔离,确保安全,仅读写工作区,无网络访问。
(Cursor)
AWS 公布 10 月 20 日重大故障原因:DynamoDB DNS 系统竞争条件导致
Amazon Web Services (AWS) 发布了 2025 年 10 月 19 日至 20 日 US-EAST-1 (弗吉尼亚北部) 区域重大服务中断的详细原因报告。此次中断的根本原因被确定为 Amazon DynamoDB 的 DNS 自动化管理系统中存在一个潜藏的竞争条件 (race condition)。
故障始于 10 月 19 日 23:48 PDT (太平洋夏令时间,北京时间 10 月 20 日 14:48)。报告称,DynamoDB 的 DNS 系统使用多个「DNS Enactor」(执行器) 组件来更新 DNS 计划。事发时,一个因异常延迟而仍在处理旧计划的执行器 (A),与一个已应用新计划并触发旧计划「清理」程序的执行器 (B) 发生冲突。
在关键的时间点,延迟的执行器 (A) 成功将其旧计划应用到了 DynamoDB 的区域端点 (dynamodb.us-east-1.amazonaws.com),覆盖了正确的记录。紧接着,执行器 (B) 的清理程序按计划删除了这个刚被激活的旧计划,导致该端点的 DNS 记录变为空白,所有解析请求失败,服务中断。
此问题导致 DynamoDB API 错误率飙升,并引发了大规模的连锁故障。首先,Amazon Elastic Compute Cloud (EC2) 的服务器管理系统 (DWFM) 因依赖 DynamoDB 而崩溃,在 DynamoDB 恢复后尝试重建租约时又引发了「拥塞崩溃」,导致新 EC2 实例启动失败。
随后,EC2 的恢复积压了大量网络配置任务,导致 Network Load Balancer (NLB) 的健康检查系统将尚未配置网络的新实例错误地判定为「不健康」并将其移除,造成 NLB 客户遭遇大量连接错误。
这一系列故障最终影响了 AWS Lambda、ECS、EKS、Amazon Connect、AWS Management Console 登录 (IAM) 和 Amazon Redshift 等多项服务。AWS 表示已在全球范围禁用该 DNS 自动化系统,将在修复竞争条件后重新启用。
(AWS)
Amazon Web Services (AWS) 发布了 2025 年 10 月 19 日至 20 日 US-EAST-1 (弗吉尼亚北部) 区域重大服务中断的详细原因报告。此次中断的根本原因被确定为 Amazon DynamoDB 的 DNS 自动化管理系统中存在一个潜藏的竞争条件 (race condition)。
故障始于 10 月 19 日 23:48 PDT (太平洋夏令时间,北京时间 10 月 20 日 14:48)。报告称,DynamoDB 的 DNS 系统使用多个「DNS Enactor」(执行器) 组件来更新 DNS 计划。事发时,一个因异常延迟而仍在处理旧计划的执行器 (A),与一个已应用新计划并触发旧计划「清理」程序的执行器 (B) 发生冲突。
在关键的时间点,延迟的执行器 (A) 成功将其旧计划应用到了 DynamoDB 的区域端点 (dynamodb.us-east-1.amazonaws.com),覆盖了正确的记录。紧接着,执行器 (B) 的清理程序按计划删除了这个刚被激活的旧计划,导致该端点的 DNS 记录变为空白,所有解析请求失败,服务中断。
此问题导致 DynamoDB API 错误率飙升,并引发了大规模的连锁故障。首先,Amazon Elastic Compute Cloud (EC2) 的服务器管理系统 (DWFM) 因依赖 DynamoDB 而崩溃,在 DynamoDB 恢复后尝试重建租约时又引发了「拥塞崩溃」,导致新 EC2 实例启动失败。
随后,EC2 的恢复积压了大量网络配置任务,导致 Network Load Balancer (NLB) 的健康检查系统将尚未配置网络的新实例错误地判定为「不健康」并将其移除,造成 NLB 客户遭遇大量连接错误。
这一系列故障最终影响了 AWS Lambda、ECS、EKS、Amazon Connect、AWS Management Console 登录 (IAM) 和 Amazon Redshift 等多项服务。AWS 表示已在全球范围禁用该 DNS 自动化系统,将在修复竞争条件后重新启用。
(AWS)
北京时间 10 月 20 日下午 3:11 (当地时间 12:11 AM PDT) 左右,Amazon Web Services (AWS) 的 US-EAST-1 (弗吉尼亚北部) 区域开始出现故障。AWS Health Dashboard 随后在 15:51 确认,该区域多种服务的错误率和延迟增加。
此次中断影响范围极大,导致全球大量网站和服务下线。据 The Independent 和 Down Detector 报道,受影响的服务包括 Snapchat、Roblox、Fortnite、Duolingo、Canva、Ring、Alexa、Perplexity、Lyft、Amazon Prime Video、Amazon Music、Coinbase、Playstation、Wordle 甚至英国税务海关总署 (HMRC)。多家媒体称此次事件为「重大互联网中断」,导致「半个互联网瘫痪」。
几乎在同一时间 (北京时间 15:16),Docker 也报告遭遇「Full Service Disruption」(全面服务中断)。Docker 状态页显示,包括 Docker Hub Registry、Docker Authentication、Docker Desktop 和 Docker Billing 在内的 18 个组件均受到影响。
(综合媒体报道)
——————
根据 AWS Health Dashboard 的最新更新,北京时间 10 月 20 日 15:11 (当地时间 0:11 AM PDT) 开始的 US-EAST-1 (弗吉尼亚北部) 区域重大故障,其根本原因已确认为「DynamoDB API 端点的 DNS 解析问题」。
AWS 表示,该底层 DNS 问题现已被「完全缓解」,大多数受影响的 AWS 服务 (包括 DynamoDB 和依赖 US-EAST-1 的全球服务) 已恢复正常运行。早先受影响的 Snapchat、Fortnite、Roblox 等第三方服务也已陆续恢复。
与此同时,Docker 的服务中断也在缓慢恢复。根据 Docker Systems Status Page 的最新状态,核心的 Docker Hub Registry (镜像仓库) 和 Docker Authentication (身份验证) 服务已恢复「Operational」(运行正常) 状态。
OpenAI 举行 Dev Day 活动,发布了:
- apps in ChatGPT
- AgentKit 工具包
- Codex 正式版
- GPT-5 pro API
- Sora 2 和新图像和语音模型 API
——————
另据本频信源,Google 即将推出 Gemini 3 系列模型,现已进入发布前的最终阶段,预期本年度内发布。
- apps in ChatGPT
- AgentKit 工具包
- Codex 正式版
- GPT-5 pro API
- Sora 2 和新图像和语音模型 API
——————
另据本频信源,Google 即将推出 Gemini 3 系列模型,现已进入发布前的最终阶段,预期本年度内发布。
Claude 正式推出新每周用量限制
Anthropic 在推出其 Claude 4.5 系列模型的同时,为 Claude 的付费订阅方案 (包括 Pro 和 Max) 正式上线了新的每周用量限制。然而,大量付费用户在 Reddit 等社交平台反映,他们的每周使用额度消耗速度远超预期。
Anthropic 官方账号在 Reddit 发布声明解释称,额度快速消耗主要是由于用户使用了更强大的 Opus 4.1 模型所致,其资源消耗远高于 Sonnet 4.5 模型。官方建议用户切换到 Sonnet 4.5 以获得更多的使用时长,并称更新后的 Sonnet 4.5 是其「目前最好的编程模型」。作为过渡期的补偿,Anthropic 为所有付费用户重置了一次每周用量,并为最高等级的 Max 20x 用户提供了额外购买用量的选项。
(Reddit)
——————
据本频信源,Anthropic 将 20x 的 Claude Max 使用 Claude Code 的使用量,限制在了每周约 800 美金,这一额度约是限制前的 1/5。
Anthropic 在推出其 Claude 4.5 系列模型的同时,为 Claude 的付费订阅方案 (包括 Pro 和 Max) 正式上线了新的每周用量限制。然而,大量付费用户在 Reddit 等社交平台反映,他们的每周使用额度消耗速度远超预期。
Anthropic 官方账号在 Reddit 发布声明解释称,额度快速消耗主要是由于用户使用了更强大的 Opus 4.1 模型所致,其资源消耗远高于 Sonnet 4.5 模型。官方建议用户切换到 Sonnet 4.5 以获得更多的使用时长,并称更新后的 Sonnet 4.5 是其「目前最好的编程模型」。作为过渡期的补偿,Anthropic 为所有付费用户重置了一次每周用量,并为最高等级的 Max 20x 用户提供了额外购买用量的选项。
(Reddit)
——————
据本频信源,Anthropic 将 20x 的 Claude Max 使用 Claude Code 的使用量,限制在了每周约 800 美金,这一额度约是限制前的 1/5。
OpenAI 发布 Sora 2。
Sora 2 是一个音视频同步生成模型,物理真实性大幅提升,且支持生成长达 16 秒的连贯叙事视频。
ChatGPT Pro 订阅用户还支持访问 Sora 2 Pro 模型。
OpenAI 同步上线了 Sora iOS App。
Sora 2 是一个音视频同步生成模型,物理真实性大幅提升,且支持生成长达 16 秒的连贯叙事视频。
ChatGPT Pro 订阅用户还支持访问 Sora 2 Pro 模型。
OpenAI 同步上线了 Sora iOS App。
Anthropic 于 9 月 30 日发布了新一代模型 Claude Sonnet 4.5,在编程能力上取得显著突破。该模型在 SWE-bench Verified 编程基准测试中排名第一,并能连续工作超过 30 小时。
此次更新同步推出多项新工具与功能:
- Claude Code 新增「检查点」功能,允许保存和回滚进度,并发布了原生 VS Code 插件。
- Claude Agent SDK 对外开放,为开发者提供构建 AI 智能体 (Agent) 的底层基础设施。
- Imagine with Claude 作为一项限时研究预览功能向 Max 订阅用户开放,可实时生成软件。
Claude Sonnet 4.5 在推理、数学及计算机操作能力上也有所提升。新模型将通过 Claude API 提供,价格与上一代 Sonnet 4 保持一致,即每百万词元 (Token) 输入 3 美元,输出 15 美元。
(Anthropic)
DeepSeek 发布了 DeepSeek-V3.2-Exp 模型。新版本引入了稀疏注意力机制 (DSA),旨在提升长文本的训练与推理效率。据官方介绍,其表现与 V3.1-Terminus 版本基本持平。
本次更新已同步覆盖官方 App、网页端及小程序。同时,此次更新也为开发者带来了福利,API 成本直降 50%,即刻生效。
目前,DeepSeek-V3.2-Exp 模型已在 HuggingFace、ModelScope 平台开源,相关技术论文也已同步公开。
(DeepSeek)
——————
据赛博禅心,智谱也即将发布GLM-4.6。
另有传言称,OpenAI 和 Google Gemini 都将于十月上旬发布模型更新。