智谱上线 GLM-5 系列模型智谱发布了新一代旗舰基座模型 GLM-5 及其编程强化版 GLM-5-Code

一个小站的自留地

智谱推出 GLM-4.7 模型智谱（Z.ai）于 12 月 23 日正式发布并开源其最新旗舰模型 GLM-4.7。该模型专为 Agentic Coding 场景优化，引入了增强的「思考模式」（Thinking Mode），包含 Interleaved Thinking、Preserved Thinking 和 Turn-level Thinking 三种机制，以提升复杂指令遵循和长程任务的稳定性。在 LMArena Code Arena 盲测中，GLM-4.7 位列开源及国内模型首位；部分基准测试（如…

智谱上线 GLM-5 系列模型

智谱发布了新一代旗舰基座模型 GLM-5 及其编程强化版 GLM-5-Code。GLM-5 面向 Agentic Engineering 打造，面向复杂系统工程与长程 Agent 任务；GLM-5-Code 则针对真实编程与 Coding Agent 场景强化了工具调用稳定性与前端生成准确性。

在规格方面，文档给出的信息显示，两款模型均为文本输入、文本输出；上下文窗口为 200K，最大输出为 128K 词元 (Token)。

在训练与架构层面， GLM-5 基座参数规模从 355B (激活 32B) 扩展至 744B (激活 40B)，预训练数据从 23T 提升至 28.5T；后训练方面引入异步强化学习框架「Slime」与异步智能体强化学习算法；长上下文方面首次集成稀疏注意力机制 (DeepSeek Sparse Attention)，以在长文本效果尽量无损的前提下降低部署成本，并提升词元效率 (Token Efficiency)。

在编程与 Agent 评测方面， GLM-5 在 SWE-bench-Verified 获得 77.8 分、在 Terminal Bench 2.0 获得 56.2 分，均为开源模型最高分数，并表示其性能超过 Gemini 3.0 Pro；文档还称其在 BrowseComp、MCP-Atlas 与 τ²-Bench 等基准中取得开源第一，并在内部 Claude Code 评估集合中显著超越 GLM-4.7。

(智谱)