一个小站的自留地
OpenAI 图像生成模型 gpt-image-1 登陆 API 2025 年 4 月 23 日,OpenAI 最新的图像生成模型 gpt-image-1 正式通过 API 向开发者和企业开放。 该模型是一个原生多模态模型,能够理解复杂的文本指令、结合世界知识生成图片,并可按照指令调整风格、内容和细节。与 DALL-E 系列相比,gpt-image-1 在图片中准确生成清晰、可读文本的能力有显著提升,解决了以往图像中出现「乱码」的问题。 Adobe、Figma、Airtable、Gamma、HeyGen…
OpenAI 发布编程智能体 Codex

OpenAI 发布了 Codex,一款集成在 ChatGPT 中的云端软件工程智能体 (Agent),旨在提升开发者的编码效率。Codex 由 codex-1 模型驱动,这是 OpenAI o3 模型的一个特调版本,专为软件工程任务进行了优化。

Codex 能够并行处理多项任务,如编写新功能、解答代码库疑问、修复程序错误 (bug) 及提交拉取请求 (Pull Request) 以供审核。每项任务均在独立的云端沙盒环境中执行,并预加载用户代码库,开发者可通过 AGENTS.MD 文件指导其行为。OpenAI 表示,codex-1 通过强化学习训练,力求生成风格贴近人类且能精确遵循指令的代码,并可持续迭代测试直至通过。

该功能已开始向 ChatGPT Pro、Team 和 Enterprise 用户推送,Plus 及 Edu 用户也将「很快」获得访问权限。初期,Codex 作为研究预览版免费提供,后续将引入用量限制和按需付费方案。

此外,OpenAI 还更新了其本地终端工具 Codex CLI,将默认采用 codex-mini-latest 模型 (codex-1 的 o4-mini 版本)。该模型通过 API 调用的价格为每百万输入词元 (Token) 1.50 美元,每百万输出词元 (Token) 6 美元。

——————

另外,AI 编程公司 Windsurf 在其被 OpenAI 收购的消息传出后,发布了自研的 SWE-1 AI 编程模型系列。该系列旨在覆盖整个软件工程流程,核心理念为「流动感知」 (Flow Awareness),强调 AI 与开发者间的自然协作。

SWE-1 系列包含三款模型:核心模型 SWE-1,官方称其具备与 Claude 3.5 Sonnet 类似的工具调用推理能力且成本更低,推广期内付费用户可免费使用;SWE-1-lite 模型,将取代此前的 Cascade Base 版本,向所有用户免费开放;以及体积最小、速度最快的 SWE-1-mini 模型,专为 Windsurf Tab 中的低延迟体验设计,亦适用于所有用户。SWE-1 系列模型目前均已在 Windsurf 中上线。

(综合媒体报道)
 
 
Back to Top