一个小站的自留地

起于小站，终于生活。
现实之外，一个普通人的思考。

博客地址：ygxz.in
讨论组：https://t.me/ygxz_group

00:44 · 2025年5月23日 · 周五

一个小站的自留地

claude.ai 的内部网络配置文件表明，Claude Sonnet 4 和 Claude Opus 4 已准备好发布，其中 Opus 被描述为 Anthropic 迄今为止最「聪明」的模型。据 The Information 报道，Claude 4 系列的一大特性，是具备了「推理 - 工具调用」之间动态切换的能力。

Claude 4 系列模型正式发布

北京时间 5 月 23 日凌晨，Anthropic 正式推出 Claude 4 系列模型，包括 Claude Opus 4 和 Claude Sonnet 4。两款模型在编码、高级推理和 AI 智能体（AI Agent）任务方面有进步。

Claude Opus 4 被 Anthropic 称为「全球最佳编程模型」，在 SWE-bench Verified 测试中取得 72.5% 的成绩，Terminal-bench 得分为 43.2%，全面领先于 OpenAI 的 o3 和谷歌的 Gemini 2.5 Pro。该模型能够连续稳定工作数小时，日本乐天集团（Rakuten）在测试中让其独立完成了一项开源代码重构任务，连续运行 7 小时且性能始终保持稳定。

Claude Sonnet 4 作为 Sonnet 3.7 的升级，在 SWE-bench 上达到 72.7% 的得分。GitHub 已宣布将其作为 GitHub Copilot 新编码智能体的基础模型。

两款模型均采用混合架构，提供近即时响应和扩展思考两种模式。在扩展思考模式下，模型可以调用网络搜索等工具，并支持并行使用多个工具。当开发者授予本地文件访问权限时，模型展现出显著增强的记忆能力，能够创建和维护「记忆文件」来存储关键信息。

Claude 4 系列现已在 claude.ai、Anthropic API、Amazon Bedrock 和 Google Cloud Vertex AI 全面上线。Sonnet 4 向免费用户开放，Pro、Max、Team 和 Enterprise 用户可使用两款模型及扩展思考功能。API 定价与前代保持一致：Opus 4 每百万词元（Token）15 美元（输入）/75 美元（输出），Sonnet 4 为 3 美元（输入）/15 美元（输出）。

同时发布的还有正式版 Claude Code，支持通过 GitHub Actions 执行后台任务，并与 VS Code 和 JetBrains 实现原生集成。Anthropic API 新增代码执行工具、MCP 连接器、文件 API 以及长达一小时的提示词缓存等四项新功能。

（综合媒体报道）

11:30 · 2025年5月22日 · 周四

一个小站的自留地

Clash Verge Rev 存在提权漏洞，多平台可提权至 root/SYSTEM 2025 年 4 月 26 日，@KawaiiZapic 披露，Tauri 框架打造的跨平台代理客户端 Clash Verge Rev（最新 2.2.4‑alpha 版本）后台服务组件存在本地提权漏洞。在 macOS 和 Linux 平台上，攻击者可提升至 root 权限；在 Windows 平台上，则可获取 SYSTEM 权限。 18:03，Clash Verge 开发组表示已定位漏洞原因，正在紧急修复中。@KawaiiZapic…

Clash Verge Rev 存在 1-Click 远程代码执行漏洞

安全研究者发现 Clash Verge Rev v2.2.4 alpha (当前最新）版本存在一个 1-Click 远程代码执行漏洞。

默认配置下，客户端在本地地址 127.0.0.1:9097 开启未经认证的 RESTful API 服务，且 CORS 配置不当，导致用户访问恶意网页时即触发本地文件写入攻击。

该攻击利用 Clash Verge 请求接口可修改 Clash 核心 Mihomo 的配置文件的特性。配置文件支持从互联网下载指定的 UI 压缩包（ZIP 或 TGZ），并自动解压到本地。尽管存在路径穿越检测，但检测仅针对 external-ui 字段，攻击者可通过 external-ui-name 字段绕过检测，进行路径穿越，实现任意文件写入。

在成功写入指定文件后，攻击者可通过常见软件（如 IDA）的插件加载机制部署恶意插件，实现远程代码执行（RCE），进一步危害用户安全。

鉴于代理软件在本地权限较高，安全风险较大。本频建议使用功能更简单的 Clash Mi 或 Mihomo Party 替代该软件。macOS 用户可使用 Stash 或 Surge 等优秀的收费闭源软件进行替代。对于其他 Clash 系软件，建议关闭 Web 控制台的公网访问权限。

Src

——————

据GobySec，实际上，远程攻击者可实现的攻击链路不仅于此，最直接的攻击链路可以通过篡改Mihomo（Clash核心）配置文件达到例如：删除配置文件导致用户机器断网或修改指定配置文件监听流量的目的。

进一步深入测试发现，不止Clash Verge ，只要对外开启了Web控制服务的Clash相关产品都存在此攻击风险。最重要的是，Clash的Web控制服务下载后默认开启的（默认端口为9090/9097），且所有历史版本（Clash ≤2.2.4 , Mihomo ≤v1.19.8）都受此漏洞影响。

08:36 · 2025年5月22日 · 周四

一个小站的自留地

与此同时，Anthropic 宣布，「Code with Claude」活动将在北京时间 5 月 23 日凌晨 0:30 开始，还将通过 anthropic.com/events 进行直播。预期该活动将发布对标前述产品的 AI 编程智能体。

claude.ai 的内部网络配置文件表明，Claude Sonnet 4 和 Claude Opus 4 已准备好发布，其中 Opus 被描述为 Anthropic 迄今为止最「聪明」的模型。

据 The Information 报道，Claude 4 系列的一大特性，是具备了「推理 - 工具调用」之间动态切换的能力。

01:13 · 2025年5月22日 · 周四

一个小站的自留地

OpenAI 发布编程智能体 Codex OpenAI 发布了 Codex，一款集成在 ChatGPT 中的云端软件工程智能体 (Agent)，旨在提升开发者的编码效率。Codex 由 codex-1 模型驱动，这是 OpenAI o3 模型的一个特调版本，专为软件工程任务进行了优化。 Codex 能够并行处理多项任务，如编写新功能、解答代码库疑问、修复程序错误 (bug) 及提交拉取请求 (Pull Request) 以供审核。每项任务均在独立的云端沙盒环境中执行，并预加载用户代码库，开发者可通过 AGENTS.MD…

OpenAI 将收购 iPhone 设计师 Jony Ive 的人工智能硬件初创公司 io，交易金额 65 亿美元。

收购完成后，Jony Ive将携其独立设计工作室LoveFrom，全面负责OpenAI未来的创意与硬件产品设计。io团队约55名核心成员也将整体并入OpenAI，其中不乏多位曾参与iPhone、Apple Watch等标志性产品的苹果前设计骨干。

目前，双方正联合研发一款“超越屏幕”的AI消费设备，预计将在2026年推出。

（Moomoo）

10:59 · 2025年5月21日 · 周三

一个小站的自留地

Google 已将其名为 Jules 的编程智能体开放全球测试。目前 Jules 测试版已无需 waiting list，任何开发者均可访问 jules.google.com，用谷歌账号登录并同步 GitHub 仓库后，立即对指定问题赋予「assign-to-jules」标签启动任务。免费配额限制为每天五个任务，谷歌计划今年晚些时候推出高级使用和企业管理功能。 —————— 与此同时，Microsoft 宣布将开源 VS Code 的 AI 编辑器功能。 VS Code 团队在 5 月 19 日…

谷歌 I/O 2025 开发者大会要点速读

- 炫耀 Gemini 2.5 Pro I/O 版本在各项基准测试中登顶
- 发布 Gemini 2.5 Pro Deep Think 版本，号称超越 OpenAI o3
- 上线 Veo 3 视频模型，首次实现视频与原生音频结合
- 发布 Imagen 4 图像模型，显著提升细节表现与排版能力
- Flow 工具整合 Veo、Imagen 和 Gemini，支持一站式视频创作
- Google 搜索引入 AI Mode，支持复杂查询及深度研究
- Project Aura 智能眼镜回归，与 Xreal 合作，集成 Gemini 能力
- Google AI Ultra 订阅推出，249.99 美元 / 月（约 1800 元）
- 编程助手 Jules 进入公测，可直接集成用户代码库

（综合媒体报道）

00:49 · 2025年5月21日 · 周三

一个小站的自留地

苹果发布 iPhone 16e：搭载自研 C1 芯片，起售价 4499 元北京时间 2 月 20 日凌晨，苹果正式发布 iPhone 16e，起售价 4499 元。作为 iPhone 16 系列的新成员，iPhone 16e 搭载了苹果自研的 C1 调制解调器芯片，并支持 Apple Intelligence 功能。 iPhone 16e 采用 6.1 英寸 OLED 屏幕，配备 A18 芯片，但 GPU 核心数从 iPhone 16 的 5 核缩减至 4 核。后置摄像头为 4800 万像素单摄，不…

Apple 宣布今年的全球开发者大会（WWDC）将于北京时间 6 月 10 日凌晨 1 点正式开幕。

据爱范儿，今年 WWDC 主题演讲的重点将放在苹果软件生态的更新上，包括 iPhone 操作系统 iOS 19 在内的多套操作系统将迎来新的接近于 visionOS的视觉风格，以及大量的交互和功能升级。

09:53 · 2025年5月20日 · 周二

一个小站的自留地

OpenAI 发布编程智能体 Codex OpenAI 发布了 Codex，一款集成在 ChatGPT 中的云端软件工程智能体 (Agent)，旨在提升开发者的编码效率。Codex 由 codex-1 模型驱动，这是 OpenAI o3 模型的一个特调版本，专为软件工程任务进行了优化。 Codex 能够并行处理多项任务，如编写新功能、解答代码库疑问、修复程序错误 (bug) 及提交拉取请求 (Pull Request) 以供审核。每项任务均在独立的云端沙盒环境中执行，并预加载用户代码库，开发者可通过 AGENTS.MD…

Google 已将其名为 Jules 的编程智能体开放全球测试。

目前 Jules 测试版已无需 waiting list，任何开发者均可访问 jules.google.com，用谷歌账号登录并同步 GitHub 仓库后，立即对指定问题赋予「assign-to-jules」标签启动任务。免费配额限制为每天五个任务，谷歌计划今年晚些时候推出高级使用和企业管理功能。

——————

与此同时，Microsoft 宣布将开源 VS Code 的 AI 编辑器功能。

VS Code 团队在 5 月 19 日的博客中直言：「我们相信代码编辑器的未来应该是开源且由 AI 驱动的」。团队计划将 GitHub Copilot Chat 扩展的代码以 MIT 许可开源，随后重构到 VS Code 核心中。

——————

与此同时，Anthropic 宣布，「Code with Claude」活动将在北京时间 5 月 23 日凌晨 0:30 开始，还将通过 anthropic.com/events 进行直播。预期该活动将发布对标前述产品的 AI 编程智能体。

（AGI Hunt）

19:21 · 2025年5月19日 · 周一

一个小站的自留地

英伟达 COMPUTEX 2024 主题演讲速评 NVIDIA 在此次演讲中备受关注，不仅业界对其寄予厚望，各路分析师也纷纷发表看法，希望这家 AI 芯片巨头能够推动一场真正的「新工业革命」。在此次 COMPUTEX 2024 演讲中，NVIDIA 释放了三大重要信号： 1. 生成式 AI 将引领新工业革命。 2. NVIDIA 正在构建完整的生成式 AI 生态，强化全栈实力。 3. NVIDIA 布局机器人、自动驾驶等新兴领域，抢占未来增长点。英伟达发布了下一代 GPU 架构 Black…

英伟达 COMPUTEX 2025 主题演讲要点总结

NVIDIA 创始人兼 CEO 黄仁勋 19 日在 Computex 2025 发表主题演讲。

黄仁勋强调，AI 已成为继电力和互联网之后的新一代基础资源，NVIDIA 正致力于打造「AI 工厂」。他在演讲中提出「The more you buy, the more you make」的理念，认为 AI 算力将成为驱动各行各业创新和增长的核心引擎。

黄仁勋宣布，NVIDIA 将与富士康、台积电等台湾伙伴合作，在台建设首个大型 AI 超级计算机，还将在台北北投士林区建立新的大型办公园区「Nvidia Constellation」。

AI 算力方面，NVIDIA 宣布其旗舰 Blackwell 平台将迎来重大升级，今年第三季度将推出 Grace Blackwell GB300 超级芯片，预计带来 1.5 倍的推理性能和 HBM 显存提升，以及 2 倍的网络能力增强。

针对个人开发者和研究者，NVIDIA 推出了 DGX Spark（搭载 GB10 芯片）个人 AI 计算机。更为强大的 DGX Station（搭载 GB300，内存高达约 800GB）则能让用户在桌面上运行万亿参数级别的 AI 大模型。

此外，NVIDIA 还展示了包括用于创建数字孪生的 Omniverse 平台、与谷歌 DeepMind 和迪士尼合作开发的 Newton 物理引擎（7 月开源）、包含 Jetson Thor 处理器和 GR00T 基础模型的 Isaac GR00T 机器人平台、面向企业负载的 RTX PRO 服务器、AI 数据平台「IQ」和 AI Ops 生态系统等成果。

（综合媒体报道，图：REUTERS）

15:04 · 2025年5月19日 · 周一

一个小站的自留地

OpenAI 推出深度研究智能体 Deep Research 北京时间 2 月 3 日，OpenAI 宣布面向深度研究领域推出智能体产品「Deep Research」，该产品能够通过推理综合大量在线信息完成多步骤研究任务。目前该功能已面向 Pro 用户开放，月均查询上限为 100 次，将逐步向 Plus、Team 和企业用户推广。免费用户也将获得「相当小」的额度。 Deep Research 基于 o3 模型构建，针对网页浏览和 Python 数据分析进行优化，具备三项核心能力： - 支持解析互联网文本、图像和…

OpenAI 更新 Deep Research 配额：

- 免费用户：基于 o4-mini 的阉割版，5 次 / 月
- Plus&Team：基于 o3 的完全版 25 次 / 月；基于 o4-mini 的阉割版，额外 15 次 / 月
- Pro：基于 o3 的完全版 250 次 / 月；基于 o4-mini 的阉割版，额外 150 次 / 月

（OpenAI）

13:40 · 2025年5月17日 · 周六

一个小站的自留地

OpenAI 图像生成模型 gpt-image-1 登陆 API 2025 年 4 月 23 日，OpenAI 最新的图像生成模型 gpt-image-1 正式通过 API 向开发者和企业开放。该模型是一个原生多模态模型，能够理解复杂的文本指令、结合世界知识生成图片，并可按照指令调整风格、内容和细节。与 DALL-E 系列相比，gpt-image-1 在图片中准确生成清晰、可读文本的能力有显著提升，解决了以往图像中出现「乱码」的问题。 Adobe、Figma、Airtable、Gamma、HeyGen…

OpenAI 发布编程智能体 Codex

OpenAI 发布了 Codex，一款集成在 ChatGPT 中的云端软件工程智能体 (Agent)，旨在提升开发者的编码效率。Codex 由 codex-1 模型驱动，这是 OpenAI o3 模型的一个特调版本，专为软件工程任务进行了优化。

Codex 能够并行处理多项任务，如编写新功能、解答代码库疑问、修复程序错误 (bug) 及提交拉取请求 (Pull Request) 以供审核。每项任务均在独立的云端沙盒环境中执行，并预加载用户代码库，开发者可通过 AGENTS.MD 文件指导其行为。OpenAI 表示，codex-1 通过强化学习训练，力求生成风格贴近人类且能精确遵循指令的代码，并可持续迭代测试直至通过。

该功能已开始向 ChatGPT Pro、Team 和 Enterprise 用户推送，Plus 及 Edu 用户也将「很快」获得访问权限。初期，Codex 作为研究预览版免费提供，后续将引入用量限制和按需付费方案。

此外，OpenAI 还更新了其本地终端工具 Codex CLI，将默认采用 codex-mini-latest 模型 (codex-1 的 o4-mini 版本)。该模型通过 API 调用的价格为每百万输入词元 (Token) 1.50 美元，每百万输出词元 (Token) 6 美元。

——————

另外，AI 编程公司 Windsurf 在其被 OpenAI 收购的消息传出后，发布了自研的 SWE-1 AI 编程模型系列。该系列旨在覆盖整个软件工程流程，核心理念为「流动感知」 (Flow Awareness)，强调 AI 与开发者间的自然协作。

SWE-1 系列包含三款模型：核心模型 SWE-1，官方称其具备与 Claude 3.5 Sonnet 类似的工具调用推理能力且成本更低，推广期内付费用户可免费使用；SWE-1-lite 模型，将取代此前的 Cascade Base 版本，向所有用户免费开放；以及体积最小、速度最快的 SWE-1-mini 模型，专为 Windsurf Tab 中的低延迟体验设计，亦适用于所有用户。SWE-1 系列模型目前均已在 Windsurf 中上线。

（综合媒体报道）

18:44 · 2025年5月13日 · 周二

一个小站的自留地

支付宝宣布更新LOGO 1月19日，支付宝宣布更新LOGO，新LOGO去掉了外框与文字，仅保留最具辨识度的「支」字标识，围绕「开放、科技、温暖」三个核心理念，同时引入立体的然光，增加通透感和流动感。 2024年，是支付宝诞生第20年。这是支付宝时隔4年再次更换 LOGO，上一次是2020年。（标志情报局）

Google 更新其移动应用程序的 Icon

Google 近日在其手机应用程序的 Icon 上应用了新的 LOGO 设计，原本四种标准色块的「G」标识，被赋予了更自然流动的渐变处理——从块状颜色转向柔和过渡，质感更高级、情绪更丰富。

Google 暂未更新其网页端的完整 LOGO，官方也暂未提供新 Icon 的解读和新闻稿。

（品牌美）

10:58 · 2025年5月7日 · 周三

洛杉矶 CoreSite LA1 数据中心断电影响多家托管商

2025年5月7日7时41分（北京时间），位于洛杉矶 West 7 Center 的 CoreSite LA1 数据中心因双路电源故障断电，导致包括 DMIT、搬瓦工 DC1、ZgoCloud 洛杉矶在内的多家云服务中断。
事故起因是一家第三方施工团队在街道作业时意外损坏了水管，触发建筑防火机制切断了主供电和备用电源。断电后，UPS 系统未能正常接管，机柜断电但环境照明及冷却系统仍在运行，消防喷淋和水压均无异常。

– 8时10分，（DMIT）确认网站和管理系统部署在该机房，其他区域服务不受影响，但控制面板仍然离线；
– 8时14分，工程师闻到机房局部烟味，机柜与机房无可见热损或水损，冷却系统和环境照明正常；
– 8时19分，确认并非真实停电，而是火警报警后为防火自动切断；未触发喷淋，无人员疏散；
– 8时48分，UPS 供应商工程师正在赶赴现场，电气工程师已到位，初步判定 UPS 自动切换出现故障，未能接管断电；
– 10时50分，UPS 技术人员即将抵达并开展修复。

（综合DMIT 公告、Bandwagonhost 状态页面）

——————

本站核心服务由CDN 集群托管，容灾策略已经完成切换；后端部署于美国东部，不受事故影响.

——————

北京时间 12:30 许，机房已经恢复供电。

08:42 · 2025年5月7日 · 周三

一个小站的自留地

谷歌即将推出 Gemini 2.5 Flash 在 Google Cloud Next '25 活动上，Google 发布了其 Gemini AI 模型家族的新成员 Gemini 2.5 Flash。该模型被定位为「主力（workhorse）」模型，特别针对低延迟和成本效益进行了优化，旨在满足高容量、实时应用场景的需求。 Gemini 2.5 Flash 的一个关键特性是其动态可控的计算能力，模型能根据提示的复杂性调整其「思考预算」或推理深度，从而在速度、准确性和成本之间取得平衡。该模型将很快通过…

Google 发布了 Gemini 2.5 Pro 的最新更新版本Gemini 2.5 Pro (I/O edition)。

Google 称其编程能力大幅提升，在所有编程排行榜上名列第一，超越 Claude 3.7 Sonnet (20250219)。

12:38 · 2025年4月29日 · 周二

一个小站的自留地

据媒体报道，阿里最快将于本月中旬发布旗舰模型的升级版，大概率是 Qwen 3。

阿里开源 Qwen3 系列模型，最小仅 6 亿参数，最大达 2350 亿参数

4 月 29 日，阿里巴巴开源了第三代千问大模型 Qwen3 系列，一口气发布了 8 个不同参数规模的模型。其中包括 6 个稠密模型和 2 个混合专家模型（MoE），覆盖从手机端到企业级服务器的各种应用场景：最小的 Qwen3-0.6B 仅有 6 亿参数，量化后只需 0.6GB 显存；最大的旗舰模型 Qwen3-235B-A22B 总参数量达 2350 亿，推理时激活 22 亿参数。

Qwen3 系列最大的创新是支持混合推理模式，通过 enable_thinking 参数控制，用户可将同一模型切换为快速响应或深度思考模式。对数学、编程等需要逻辑推理的问题启用思考模式，而摘要等简单任务则使用非推理模式提升速度。

在性能方面，旗舰模型 Qwen3-235B-A22B 在 LiveCodeBench 编程评测中得分达 70.7 分，超过了 OpenAI 的 o1、DeepSeek-R1 等顶级模型。体积较小的 Qwen3-4B 性能已可媲美上一代的 Qwen2.5-72B-Instruct。此外，Qwen3 系列支持 119 种语言（上一代仅 29 种），强化了 Agent 能力和 MCP 协议支持，并将上下文窗口扩展至最大 128K。

所有 Qwen3 系列模型均采用 Apache 2.0 协议开源，完全免费商用，部署成本约为 DeepSeek-R1 的三分之一。用户可在 Hugging Face、ModelScope 和 Kaggle 等平台获取模型权重。

（DataLearner）

00:42 · 2025年4月29日 · 周二

一个小站的自留地

中国 IPv6 活跃用户数占比达 73% IPv6 是全球公认的下一代互联网发展方向，近年来取得了显著增长。截至 2024 年 5 月，全球 IPv6 支持率约为 39%。在此背景下，中国 IPv6 规模部署也取得了显著进展。截至 2024 年 4 月，中国 IPv6 地址拥有量为 67459 块/32，位居全球第二，占全球 IPv6 地址的 15.05%。截至 2024 年 4 月，中国 IPv6 活跃用户数达 7.878 亿，占网民总数的 73.01%，相比 2019 年的 24.35% 大幅提升。此外，中国移动网…

亚太地区IPv6支持率超50%

4月25日，APNIC（亚太互联网络信息中心）实验室的记录显示，在所有56个APNIC经济体中，IPv6支持率30天平均值持续超50%，这是亚太地区自开始使用IPv6的25年后抵达的一个重要里程碑。

18:57 · 2025年4月26日 · 周六

Clash Verge Rev 存在提权漏洞，多平台可提权至 root/SYSTEM

2025 年 4 月 26 日，@KawaiiZapic 披露，Tauri 框架打造的跨平台代理客户端 Clash Verge Rev（最新 2.2.4‑alpha 版本）后台服务组件存在本地提权漏洞。在 macOS 和 Linux 平台上，攻击者可提升至 root 权限；在 Windows 平台上，则可获取 SYSTEM 权限。

18:03，Clash Verge 开发组表示已定位漏洞原因，正在紧急修复中。@KawaiiZapic 还建议用户采取以下临时对策：
- Windows：打开「服务管理」，禁用 clash‑verge‑service 服务
- Linux：执行 systemctl 停止并禁用 clash‑verge‑service
- macOS：在「系统设置」中关闭名为 “won fen” 的后台自启动权限

（Github issue）（X）

17:16 · 2025年4月24日 · 周四

一个小站的自留地

OpenAI 正式发布 o3 与 o4-mini OpenAI 于 2025 年 4 月 17 日凌晨正式发布了全新推理模型 o3 与 o4-mini。 o3 模型在 Codeforces、SWE-bench、MMMU 等权威测试中得分均超 2700 分，全球排名前 200，外部专家评价其「接近或达到天才水平」。不过，这一智力提升的代价是算力需求达到 o1 的十倍以上。 o4-mini 则以小巧高效著称，在 2025 年 AIME 数学竞赛中配合 Python 解释器取得 99.5% 的高分，性能全面超越…

OpenAI 图像生成模型 gpt-image-1 登陆 API

2025 年 4 月 23 日，OpenAI 最新的图像生成模型 gpt-image-1 正式通过 API 向开发者和企业开放。

该模型是一个原生多模态模型，能够理解复杂的文本指令、结合世界知识生成图片，并可按照指令调整风格、内容和细节。与 DALL-E 系列相比，gpt-image-1 在图片中准确生成清晰、可读文本的能力有显著提升，解决了以往图像中出现「乱码」的问题。

Adobe、Figma、Airtable、Gamma、HeyGen 等平台已集成该模型。在计价方面，输入文本 5 美元/百万词元，图片输入 10 美元/百万词元，图片输出 40 美元/百万词元，平均每张图片成本约 2-19 美分。所有开发者层级均可访问，但需通过 OpenAI API 实名验证。

09:14 · 2025年4月17日 · 周四

一个小站的自留地

OpenAI 发布 GPT-4.1 系列模型，支持百万 token 上下文北京时间 2025 年 4 月 15 日凌晨，OpenAI 发布 GPT-4.1 系列模型，包括 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 三款产品。这系列模型主要有三大特点：编程能力大幅提升、指令遵循更加精准以及支持高达 100 万 token 的超长上下文。在 SWE-bench Verified 测试中，GPT-4.1 得分 54.6%，比 GPT-4o 提升 21.4 个百分点，比 GPT…

OpenAI 正式发布 o3 与 o4-mini

OpenAI 于 2025 年 4 月 17 日凌晨正式发布了全新推理模型 o3 与 o4-mini。

o3 模型在 Codeforces、SWE-bench、MMMU 等权威测试中得分均超 2700 分，全球排名前 200，外部专家评价其「接近或达到天才水平」。不过，这一智力提升的代价是算力需求达到 o1 的十倍以上。

o4-mini 则以小巧高效著称，在 2025 年 AIME 数学竞赛中配合 Python 解释器取得 99.5% 的高分，性能全面超越 o3-mini，适合高并发和成本敏感场景。

两款模型均已在 ChatGPT Plus、Pro 和 Team 用户端上线，并通过 API 向开发者开放。o3-pro 版本预计数周内发布。

（综合媒体报道）

10:33 · 2025年4月15日 · 周二

一个小站的自留地

OpenRouter 推出匿名模型 Quasar Alpha，疑似 GPT-4.5 Preview 蒸馏版本 OpenRouter 于 2025 年 4 月 4 日上线一个匿名模型 Quasar Alpha。这是一个来自某个模型实验室的基础模型 (foundation model) 的预发布版本，目前已在 OpenRouter 平台上免费提供给所有用户试用。 Quasar Alpha 拥有 100 万词元 (Token) 的上下文长度，专为编码进行了优化，同时也具备通用能力。用户报告称，尽管该模型并…

OpenAI 发布 GPT-4.1 系列模型，支持百万 token 上下文

北京时间 2025 年 4 月 15 日凌晨，OpenAI 发布 GPT-4.1 系列模型，包括 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 三款产品。

这系列模型主要有三大特点：编程能力大幅提升、指令遵循更加精准以及支持高达 100 万 token 的超长上下文。

在 SWE-bench Verified 测试中，GPT-4.1 得分 54.6%，比 GPT-4o 提升 21.4 个百分点，比 GPT-4.5 提升 26.6 个百分点。

GPT-4.1 mini 表现超越 GPT-4o，同时较后者延迟降低近 50%，成本降低 83%。

最小型号 GPT-4.1 nano 是 OpenAI 目前速度最快、成本最低的模型，输入价格仅 0.7 元/百万 token。

GPT-4.1 系列目前仅能通过 API 使用，不会直接出现在 ChatGPT 中，但 ChatGPT 的 GPT-4o 已整合部分 GPT-4.1 功能。同时，OpenAI 宣布 GPT-4.5 Preview 将于 2025 年 7 月 14 日下线。

据传 OpenAI 还在开发类似费曼式的推理模型，能跨学科整合概念提出创新实验，甚至打算推出月费高达 14 万元的博士级研究服务。

（综合媒体报道）

14:37 · 2025年4月13日 · 周日

一个小站的自留地

微软中国区外包团队受美国数据安全新规影响被裁撤 2025 年 4 月 7 日上午，一张声称「微软停止中国区运营」的邮件截图在网络流传。该邮件称，由于地缘政治及国际业务环境变化，微软将调整全球战略布局，并于 2025 年 4 月 8 日起正式停止在中国区的运营。经钛媒体向微软内部人士求证，该邮件实为微软在中国的众多外包服务商之一——上海微创软件股份有限公司（Wicresoft）发给其内部微软项目团队的通知。邮件中提及的「停止在中国区的运营」实际上是指上海微创的微软项目团队将终止相关工作，而非微软中国（Microsoft…

Github 现已屏蔽来自中国大陆的未登录访问。已登录用户目前不受影响。

本频测试，在不开启代理的情况下，仍然能打开登录页面，但是有几率登录失败。

（Github Discussion）
——————
4月14日更新：

根据 GitHub 官方状态页面发布的信息，由于一项配置变更产生了意外影响，未登录状态下尝试从中国访问 GitHub.com 的用户在过去一天内暂时无法访问该网站。

该事件于北京时间 2025 年 4 月 13 日凌晨 4:01 开始，直到当天晚上 22:55 才得到缓解，影响持续了近 19 个小时。

GitHub 官方表示，此次事件仅影响未登录用户，已登录的用户在此期间仍能正常访问平台服务。GitHub 在其官方状态页面上发布了回溯性报告，确认「导致此影响的配置变更已被撤销，用户在尝试访问 GitHub.com 时应不再遇到问题。」

（Github）

Before

After

Home

个人博客

讨论组