智谱发布了新一代旗舰基座模型 GLM-5 及其编程强化版 GLM-5-Code。GLM-5 面向 Agentic Engineering 打造,面向复杂系统工程与长程 Agent 任务;GLM-5-Code 则针对真实编程与 Coding Agent 场景强化了工具调用稳定性与前端生成准确性。
在规格方面,文档给出的信息显示,两款模型均为文本输入、文本输出;上下文窗口为 200K,最大输出为 128K 词元 (Token)。
在训练与架构层面, GLM-5 基座参数规模从 355B (激活 32B) 扩展至 744B (激活 40B),预训练数据从 23T 提升至 28.5T;后训练方面引入异步强化学习框架「Slime」与异步智能体强化学习算法;长上下文方面首次集成稀疏注意力机制 (DeepSeek Sparse Attention),以在长文本效果尽量无损的前提下降低部署成本,并提升词元效率 (Token Efficiency)。
在编程与 Agent 评测方面, GLM-5 在 SWE-bench-Verified 获得 77.8 分、在 Terminal Bench 2.0 获得 56.2 分,均为开源模型最高分数,并表示其性能超过 Gemini 3.0 Pro;文档还称其在 BrowseComp、MCP-Atlas 与 τ²-Bench 等基准中取得开源第一,并在内部 Claude Code 评估集合中显著超越 GLM-4.7。
(智谱)