起于小站,终于生活。
现实之外,一个普通人的思考。

博客地址:ygxz.in
讨论组:https://t.me/+a5Clq4jLuJc4YWQ9
一个小站的自留地
Google 已将其名为 Jules 的编程智能体开放全球测试。 目前 Jules 测试版已无需 waiting list,任何开发者均可访问 jules.google.com,用谷歌账号登录并同步 GitHub 仓库后,立即对指定问题赋予「assign-to-jules」标签启动任务。免费配额限制为每天五个任务,谷歌计划今年晚些时候推出高级使用和企业管理功能。 —————— 与此同时,Microsoft 宣布将开源 VS Code 的 AI 编辑器功能。 VS Code 团队在 5 月 19 日…
谷歌 I/O 2025 开发者大会要点速读

- 炫耀 Gemini 2.5 Pro I/O 版本在各项基准测试中登顶
- 发布 Gemini 2.5 Pro Deep Think 版本,号称超越 OpenAI o3
- 上线 Veo 3 视频模型,首次实现视频与原生音频结合
- 发布 Imagen 4 图像模型,显著提升细节表现与排版能力
- Flow 工具整合 Veo、Imagen 和 Gemini,支持一站式视频创作
- Google 搜索引入 AI Mode,支持复杂查询及深度研究
- Project Aura 智能眼镜回归,与 Xreal 合作,集成 Gemini 能力
- Google AI Ultra 订阅推出,249.99 美元 / 月(约 1800 元)
- 编程助手 Jules 进入公测,可直接集成用户代码库

(综合媒体报道)
一个小站的自留地
OpenAI 发布编程智能体 Codex OpenAI 发布了 Codex,一款集成在 ChatGPT 中的云端软件工程智能体 (Agent),旨在提升开发者的编码效率。Codex 由 codex-1 模型驱动,这是 OpenAI o3 模型的一个特调版本,专为软件工程任务进行了优化。 Codex 能够并行处理多项任务,如编写新功能、解答代码库疑问、修复程序错误 (bug) 及提交拉取请求 (Pull Request) 以供审核。每项任务均在独立的云端沙盒环境中执行,并预加载用户代码库,开发者可通过 AGENTS.MD…
Google 已将其名为 Jules 的编程智能体开放全球测试。

目前 Jules 测试版已无需 waiting list,任何开发者均可访问 jules.google.com,用谷歌账号登录并同步 GitHub 仓库后,立即对指定问题赋予「assign-to-jules」标签启动任务。免费配额限制为每天五个任务,谷歌计划今年晚些时候推出高级使用和企业管理功能。

——————

与此同时,Microsoft 宣布将开源 VS Code 的 AI 编辑器功能。

VS Code 团队在 5 月 19 日的博客中直言:「我们相信代码编辑器的未来应该是开源且由 AI 驱动的」。团队计划将 GitHub Copilot Chat 扩展的代码以 MIT 许可开源,随后重构到 VS Code 核心中。

——————

与此同时,Anthropic 宣布,「Code with Claude」活动将在北京时间 5 月 23 日凌晨 0:30 开始,还将通过 anthropic.com/events 进行直播。预期该活动将发布对标前述产品的 AI 编程智能体。

(AGI Hunt)
一个小站的自留地
英伟达 COMPUTEX 2024 主题演讲速评 NVIDIA 在此次演讲中备受关注,不仅业界对其寄予厚望,各路分析师也纷纷发表看法,希望这家 AI 芯片巨头能够推动一场真正的「新工业革命」。 在此次 COMPUTEX 2024 演讲中,NVIDIA 释放了三大重要信号: 1. 生成式 AI 将引领新工业革命。 2. NVIDIA 正在构建完整的生成式 AI 生态,强化全栈实力。 3. NVIDIA 布局机器人、自动驾驶等新兴领域,抢占未来增长点。 英伟达发布了下一代 GPU 架构 Black…
英伟达 COMPUTEX 2025 主题演讲要点总结

NVIDIA 创始人兼 CEO 黄仁勋 19 日在 Computex 2025 发表主题演讲。

黄仁勋强调,AI 已成为继电力和互联网之后的新一代基础资源,NVIDIA 正致力于打造「AI 工厂」。他在演讲中提出「The more you buy, the more you make」的理念,认为 AI 算力将成为驱动各行各业创新和增长的核心引擎。

黄仁勋宣布,NVIDIA 将与富士康、台积电等台湾伙伴合作,在台建设首个大型 AI 超级计算机,还将在台北北投士林区建立新的大型办公园区「Nvidia Constellation」。

AI 算力方面,NVIDIA 宣布其旗舰 Blackwell 平台将迎来重大升级,今年第三季度将推出 Grace Blackwell GB300 超级芯片,预计带来 1.5 倍的推理性能和 HBM 显存提升,以及 2 倍的网络能力增强。

针对个人开发者和研究者,NVIDIA 推出了 DGX Spark(搭载 GB10 芯片)个人 AI 计算机。更为强大的 DGX Station(搭载 GB300,内存高达约 800GB)则能让用户在桌面上运行万亿参数级别的 AI 大模型。

此外,NVIDIA 还展示了包括用于创建数字孪生的 Omniverse 平台、与谷歌 DeepMind 和迪士尼合作开发的 Newton 物理引擎(7 月开源)、包含 Jetson Thor 处理器和 GR00T 基础模型的 Isaac GR00T 机器人平台、面向企业负载的 RTX PRO 服务器、AI 数据平台「IQ」和 AI Ops 生态系统等成果。

(综合媒体报道,图:REUTERS
一个小站的自留地
OpenAI 图像生成模型 gpt-image-1 登陆 API 2025 年 4 月 23 日,OpenAI 最新的图像生成模型 gpt-image-1 正式通过 API 向开发者和企业开放。 该模型是一个原生多模态模型,能够理解复杂的文本指令、结合世界知识生成图片,并可按照指令调整风格、内容和细节。与 DALL-E 系列相比,gpt-image-1 在图片中准确生成清晰、可读文本的能力有显著提升,解决了以往图像中出现「乱码」的问题。 Adobe、Figma、Airtable、Gamma、HeyGen…
OpenAI 发布编程智能体 Codex

OpenAI 发布了 Codex,一款集成在 ChatGPT 中的云端软件工程智能体 (Agent),旨在提升开发者的编码效率。Codex 由 codex-1 模型驱动,这是 OpenAI o3 模型的一个特调版本,专为软件工程任务进行了优化。

Codex 能够并行处理多项任务,如编写新功能、解答代码库疑问、修复程序错误 (bug) 及提交拉取请求 (Pull Request) 以供审核。每项任务均在独立的云端沙盒环境中执行,并预加载用户代码库,开发者可通过 AGENTS.MD 文件指导其行为。OpenAI 表示,codex-1 通过强化学习训练,力求生成风格贴近人类且能精确遵循指令的代码,并可持续迭代测试直至通过。

该功能已开始向 ChatGPT Pro、Team 和 Enterprise 用户推送,Plus 及 Edu 用户也将「很快」获得访问权限。初期,Codex 作为研究预览版免费提供,后续将引入用量限制和按需付费方案。

此外,OpenAI 还更新了其本地终端工具 Codex CLI,将默认采用 codex-mini-latest 模型 (codex-1 的 o4-mini 版本)。该模型通过 API 调用的价格为每百万输入词元 (Token) 1.50 美元,每百万输出词元 (Token) 6 美元。

——————

另外,AI 编程公司 Windsurf 在其被 OpenAI 收购的消息传出后,发布了自研的 SWE-1 AI 编程模型系列。该系列旨在覆盖整个软件工程流程,核心理念为「流动感知」 (Flow Awareness),强调 AI 与开发者间的自然协作。

SWE-1 系列包含三款模型:核心模型 SWE-1,官方称其具备与 Claude 3.5 Sonnet 类似的工具调用推理能力且成本更低,推广期内付费用户可免费使用;SWE-1-lite 模型,将取代此前的 Cascade Base 版本,向所有用户免费开放;以及体积最小、速度最快的 SWE-1-mini 模型,专为 Windsurf Tab 中的低延迟体验设计,亦适用于所有用户。SWE-1 系列模型目前均已在 Windsurf 中上线。

(综合媒体报道)
一个小站的自留地
支付宝宣布更新LOGO 1月19日,支付宝宣布更新LOGO,新LOGO去掉了外框与文字,仅保留最具辨识度的「支」字标识,围绕「开放、科技、温暖」三个核心理念,同时引入立体的然光,增加通透感和流动感。 2024年,是支付宝诞生第20年。 这是支付宝时隔4年再次更换 LOGO,上一次是2020年。 (标志情报局)
Google 更新其移动应用程序的 Icon

Google 近日在其手机应用程序的 Icon 上应用了新的 LOGO 设计,原本四种标准色块的「G」标识,被赋予了更自然流动的渐变处理——从块状颜色转向柔和过渡,质感更高级、情绪更丰富。

Google 暂未更新其网页端的完整 LOGO,官方也暂未提供新 Icon 的解读和新闻稿。

品牌美
洛杉矶 CoreSite LA1 数据中心断电 影响多家托管商

2025年5月7日7时41分(北京时间),位于洛杉矶 West 7 Center 的 CoreSite LA1 数据中心因双路电源故障断电,导致包括 DMIT、搬瓦工 DC1、ZgoCloud 洛杉矶在内的多家云服务中断。
事故起因是一家第三方施工团队在街道作业时意外损坏了水管,触发建筑防火机制切断了主供电和备用电源。断电后,UPS 系统未能正常接管,机柜断电但环境照明及冷却系统仍在运行,消防喷淋和水压均无异常。

– 8时10分,(DMIT)确认网站和管理系统部署在该机房,其他区域服务不受影响,但控制面板仍然离线;
– 8时14分,工程师闻到机房局部烟味,机柜与机房无可见热损或水损,冷却系统和环境照明正常;
– 8时19分,确认并非真实停电,而是火警报警后为防火自动切断;未触发喷淋,无人员疏散;
– 8时48分,UPS 供应商工程师正在赶赴现场,电气工程师已到位,初步判定 UPS 自动切换出现故障,未能接管断电;
– 10时50分,UPS 技术人员即将抵达并开展修复。

(综合DMIT 公告、Bandwagonhost 状态页面)

——————

本站核心服务由CDN 集群托管,容灾策略已经完成切换;后端部署于美国东部,不受事故影响.

——————

北京时间 12:30 许,机房已经恢复供电。
一个小站的自留地
据媒体报道,阿里最快将于本月中旬发布旗舰模型的升级版,大概率是 Qwen 3。
阿里开源 Qwen3 系列模型,最小仅 6 亿参数,最大达 2350 亿参数

4 月 29 日,阿里巴巴开源了第三代千问大模型 Qwen3 系列,一口气发布了 8 个不同参数规模的模型。其中包括 6 个稠密模型和 2 个混合专家模型(MoE),覆盖从手机端到企业级服务器的各种应用场景:最小的 Qwen3-0.6B 仅有 6 亿参数,量化后只需 0.6GB 显存;最大的旗舰模型 Qwen3-235B-A22B 总参数量达 2350 亿,推理时激活 22 亿参数。

Qwen3 系列最大的创新是支持混合推理模式,通过 enable_thinking 参数控制,用户可将同一模型切换为快速响应或深度思考模式。对数学、编程等需要逻辑推理的问题启用思考模式,而摘要等简单任务则使用非推理模式提升速度。

在性能方面,旗舰模型 Qwen3-235B-A22B 在 LiveCodeBench 编程评测中得分达 70.7 分,超过了 OpenAI 的 o1、DeepSeek-R1 等顶级模型。体积较小的 Qwen3-4B 性能已可媲美上一代的 Qwen2.5-72B-Instruct。此外,Qwen3 系列支持 119 种语言(上一代仅 29 种),强化了 Agent 能力和 MCP 协议支持,并将上下文窗口扩展至最大 128K。

所有 Qwen3 系列模型均采用 Apache 2.0 协议开源,完全免费商用,部署成本约为 DeepSeek-R1 的三分之一。用户可在 Hugging Face、ModelScope 和 Kaggle 等平台获取模型权重。

(DataLearner)
Clash Verge Rev 存在提权漏洞,多平台可提权至 root/SYSTEM

2025 年 4 月 26 日,@KawaiiZapic 披露,Tauri 框架打造的跨平台代理客户端 Clash Verge Rev(最新 2.2.4‑alpha 版本)后台服务组件存在本地提权漏洞。在 macOS 和 Linux 平台上,攻击者可提升至 root 权限;在 Windows 平台上,则可获取 SYSTEM 权限。

18:03,Clash Verge 开发组表示已定位漏洞原因,正在紧急修复中。@KawaiiZapic 还建议用户采取以下临时对策:
- Windows:打开「服务管理」,禁用 clash‑verge‑service 服务
- Linux:执行 systemctl 停止并禁用 clash‑verge‑service
- macOS:在「系统设置」中关闭名为 “won fen” 的后台自启动权限

Github issue) (X
一个小站的自留地
OpenAI 正式发布 o3 与 o4-mini OpenAI 于 2025 年 4 月 17 日凌晨正式发布了全新推理模型 o3 与 o4-mini。 o3 模型在 Codeforces、SWE-bench、MMMU 等权威测试中得分均超 2700 分,全球排名前 200,外部专家评价其「接近或达到天才水平」。不过,这一智力提升的代价是算力需求达到 o1 的十倍以上。 o4-mini 则以小巧高效著称,在 2025 年 AIME 数学竞赛中配合 Python 解释器取得 99.5% 的高分,性能全面超越…
OpenAI 图像生成模型 gpt-image-1 登陆 API

2025 年 4 月 23 日,OpenAI 最新的图像生成模型 gpt-image-1 正式通过 API 向开发者和企业开放。

该模型是一个原生多模态模型,能够理解复杂的文本指令、结合世界知识生成图片,并可按照指令调整风格、内容和细节。与 DALL-E 系列相比,gpt-image-1 在图片中准确生成清晰、可读文本的能力有显著提升,解决了以往图像中出现「乱码」的问题。

Adobe、Figma、Airtable、Gamma、HeyGen 等平台已集成该模型。在计价方面,输入文本 5 美元/百万词元,图片输入 10 美元/百万词元,图片输出 40 美元/百万词元,平均每张图片成本约 2-19 美分。所有开发者层级均可访问,但需通过 OpenAI API 实名验证。
一个小站的自留地
OpenAI 发布 GPT-4.1 系列模型,支持百万 token 上下文 北京时间 2025 年 4 月 15 日凌晨,OpenAI 发布 GPT-4.1 系列模型,包括 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 三款产品。 这系列模型主要有三大特点:编程能力大幅提升、指令遵循更加精准以及支持高达 100 万 token 的超长上下文。 在 SWE-bench Verified 测试中,GPT-4.1 得分 54.6%,比 GPT-4o 提升 21.4 个百分点,比 GPT…
OpenAI 正式发布 o3 与 o4-mini

OpenAI 于 2025 年 4 月 17 日凌晨正式发布了全新推理模型 o3 与 o4-mini。

o3 模型在 Codeforces、SWE-bench、MMMU 等权威测试中得分均超 2700 分,全球排名前 200,外部专家评价其「接近或达到天才水平」。不过,这一智力提升的代价是算力需求达到 o1 的十倍以上。

o4-mini 则以小巧高效著称,在 2025 年 AIME 数学竞赛中配合 Python 解释器取得 99.5% 的高分,性能全面超越 o3-mini,适合高并发和成本敏感场景。

两款模型均已在 ChatGPT Plus、Pro 和 Team 用户端上线,并通过 API 向开发者开放。o3-pro 版本预计数周内发布。

(综合媒体报道)
一个小站的自留地
OpenRouter 推出匿名模型 Quasar Alpha,疑似 GPT-4.5 Preview 蒸馏版本 OpenRouter 于 2025 年 4 月 4 日上线一个匿名模型 Quasar Alpha。这是一个来自某个模型实验室的基础模型 (foundation model) 的预发布版本,目前已在 OpenRouter 平台上免费提供给所有用户试用。 Quasar Alpha 拥有 100 万词元 (Token) 的上下文长度,专为编码进行了优化,同时也具备通用能力 。用户报告称,尽管该模型并…
OpenAI 发布 GPT-4.1 系列模型,支持百万 token 上下文

北京时间 2025 年 4 月 15 日凌晨,OpenAI 发布 GPT-4.1 系列模型,包括 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 三款产品。

这系列模型主要有三大特点:编程能力大幅提升、指令遵循更加精准以及支持高达 100 万 token 的超长上下文

在 SWE-bench Verified 测试中,GPT-4.1 得分 54.6%,比 GPT-4o 提升 21.4 个百分点,比 GPT-4.5 提升 26.6 个百分点。

GPT-4.1 mini 表现超越 GPT-4o,同时较后者延迟降低近 50%,成本降低 83%。

最小型号 GPT-4.1 nano 是 OpenAI 目前速度最快、成本最低的模型,输入价格仅 0.7 元/百万 token。

GPT-4.1 系列目前仅能通过 API 使用,不会直接出现在 ChatGPT 中,但 ChatGPT 的 GPT-4o 已整合部分 GPT-4.1 功能。同时,OpenAI 宣布 GPT-4.5 Preview 将于 2025 年 7 月 14 日下线。

据传 OpenAI 还在开发类似费曼式的推理模型,能跨学科整合概念提出创新实验,甚至打算推出月费高达 14 万元的博士级研究服务。

(综合媒体报道)
一个小站的自留地
微软中国区外包团队受美国数据安全新规影响被裁撤 2025 年 4 月 7 日上午,一张声称「微软停止中国区运营」的邮件截图在网络流传 。该邮件称,由于地缘政治及国际业务环境变化,微软将调整全球战略布局,并于 2025 年 4 月 8 日起正式停止在中国区的运营 。 经钛媒体向微软内部人士求证,该邮件实为微软在中国的众多外包服务商之一——上海微创软件股份有限公司(Wicresoft)发给其内部微软项目团队的通知 。邮件中提及的「停止在中国区的运营」实际上是指上海微创的微软项目团队将终止相关工作,而非微软中国(Microsoft…
Github 现已屏蔽来自中国大陆的未登录访问。已登录用户目前不受影响。

本频测试,在不开启代理的情况下,仍然能打开登录页面,但是有几率登录失败。

(Github Discussion)
——————
4月14日更新:

根据 GitHub 官方状态页面发布的信息,由于一项配置变更产生了意外影响,未登录状态下尝试从中国访问 GitHub.com 的用户在过去一天内暂时无法访问该网站。

该事件于北京时间 2025 年 4 月 13 日凌晨 4:01 开始,直到当天晚上 22:55 才得到缓解,影响持续了近 19 个小时。

GitHub 官方表示,此次事件仅影响未登录用户,已登录的用户在此期间仍能正常访问平台服务。GitHub 在其官方状态页面上发布了回溯性报告,确认「导致此影响的配置变更已被撤销,用户在尝试访问 GitHub.com 时应不再遇到问题。」

(Github)
一个小站的自留地
谷歌发布 Gemini 2.5 Pro 实验模型 谷歌称, Gemini 2.5是其最新的AI模型,具备推理能力,能够处理复杂问题,首次发布的实验版本Gemini 2.5 Pro在多个基准测试中表现优异,位列LMArena排行榜第一。 Gemini 2.5 Pro支持1百万个令牌的上下文窗口,能够处理来自文本、音频、图像和视频的复杂数据,提升了对多种信息源的理解能力。 该模型在编码方面取得了显著进步,能够创建视觉吸引力强的网页应用和代码转换,SWE-Bench Verified测试中得分为63.8%。…
谷歌即将推出 Gemini 2.5 Flash

在 Google Cloud Next '25 活动上,Google 发布了其 Gemini AI 模型家族的新成员 Gemini 2.5 Flash。该模型被定位为「主力(workhorse)」模型,特别针对低延迟和成本效益进行了优化,旨在满足高容量、实时应用场景的需求。

Gemini 2.5 Flash 的一个关键特性是其动态可控的计算能力,模型能根据提示的复杂性调整其「思考预算」或推理深度,从而在速度、准确性和成本之间取得平衡。

该模型将很快通过 Google Cloud 的 Vertex AI 平台提供。

(Google Cloud Blog)
一个小站的自留地
Open AI 更新了 GPT-4o 的图像生成功能,现在 GPT-4o 可以利用其多模态能力和上下文信息生成高质量图像。 这一功能无论是文字渲染还是风格控制上,都已达到图片生成的第一梯队。 这一功能最早于 26 日凌晨面向 Pro 用户可用,正逐步向 Plus 用户开放。
OpenRouter 推出匿名模型 Quasar Alpha,疑似 GPT-4.5 Preview 蒸馏版本

OpenRouter 于 2025 年 4 月 4 日上线一个匿名模型 Quasar Alpha。这是一个来自某个模型实验室的基础模型 (foundation model) 的预发布版本,目前已在 OpenRouter 平台上免费提供给所有用户试用。

Quasar Alpha 拥有 100 万词元 (Token) 的上下文长度,专为编码进行了优化,同时也具备通用能力 。用户报告称,尽管该模型并非主要设计为推理模型,但其在数学推理和竞技编程方面表现出色,并支持图像识别功能。根据 Aider 多语言编码基准测试,其得分率为 55%,与 DeepSeek V3 和 Claude 3.5 Sonnet 相当。

所有提交给 Quasar Alpha 的提示 (prompt) 和生成内容都将被 OpenRouter 及模型提供方记录,用于理解模型使用情况并进行改进。

关于 Quasar Alpha 的开发者身份,尽管官方保持沉默,但大量技术证据指向了 OpenAI。分析发现,该模型的 API 响应中包含 OpenAI 特有的「chatcmpl-」前缀,工具调用 ID 格式也与 OpenAI 完全一致,而与其他主要 AI 开发商 (如 Google、Mistral) 不同。此外,Quasar Alpha 分词器 (tokenizer) 中一个独特的中文响应错误,与 OpenAI 分词器系统已知的问题高度相似 。AI 研究员 Sam Paech 使用生物信息学聚类工具进行的分析也显示,Quasar Alpha 在模型家族树中与 GPT-4.5 Preview 最为接近

(OpenRouter, Reddit)
微软中国区外包团队受美国数据安全新规影响被裁撤

2025 年 4 月 7 日上午,一张声称「微软停止中国区运营」的邮件截图在网络流传 。该邮件称,由于地缘政治及国际业务环境变化,微软将调整全球战略布局,并于 2025 年 4 月 8 日起正式停止在中国区的运营 。

经钛媒体向微软内部人士求证,该邮件实为微软在中国的众多外包服务商之一——上海微创软件股份有限公司(Wicresoft)发给其内部微软项目团队的通知 。邮件中提及的「停止在中国区的运营」实际上是指上海微创的微软项目团队将终止相关工作,而非微软中国(Microsoft China)停止运营 。上海微创软件股份有限公司是一家全球数字化转型服务商,于 2002 年由微软与上海市政府共同创办 。

此次上海微创微软项目团队的终止,与美国拜登政府于 2024 年 2 月 28 日签署并要求美国司法部制定具体规则的第 14117 号行政令 (Executive Order 14117, Preventing Access to Americans' Bulk Sensitive Personal Data and United States Government-Related Data by Countries of Concern) 有关 。该行政令及其最终规则旨在阻止包括中国(含香港和澳门特别行政区)、俄罗斯、伊朗、朝鲜、古巴和委内瑞拉在内的「受关注国家 (Countries of Concern)」以及相关「受涵盖人员 (Covered Persons)」访问美国人的「批量敏感个人数据 (Bulk U.S. Sensitive Personal Data)」和「美国政府相关数据 (United States Government-related Data)」。

根据 EO 14117 的最终规则,自 2025 年 4 月 8 日起,位于受关注国家(包括中国大陆)的个人(包括美国公司的员工以及外包团队成员)将被限制访问特定类型的美国敏感个人数据和政府相关数据,特别是托管在北美的数据中心的数据 。这项限制将在 2025 年 10 月 6 日进一步扩展至全球范围 ,即身在中国大陆的人员将不能访问其他地区的部分数据(内部业务、工具类等不包含个人、用户信息的数据除外)。

(综合媒体报道)
Back to Top