一个小站的自留地
智谱推出 GLM-4.7 模型 智谱(Z.ai)于 12 月 23 日正式发布并开源其最新旗舰模型 GLM-4.7。该模型专为 Agentic Coding 场景优化,引入了增强的「思考模式」(Thinking Mode),包含 Interleaved Thinking、Preserved Thinking 和 Turn-level Thinking 三种机制,以提升复杂指令遵循和长程任务的稳定性。 在 LMArena Code Arena 盲测中,GLM-4.7 位列开源及国内模型首位;部分基准测试(如…
智谱上线 GLM-5 系列模型

智谱发布了新一代旗舰基座模型 GLM-5 及其编程强化版 GLM-5-Code。GLM-5 面向 Agentic Engineering 打造,面向复杂系统工程与长程 Agent 任务;GLM-5-Code 则针对真实编程与 Coding Agent 场景强化了工具调用稳定性与前端生成准确性。

在规格方面,文档给出的信息显示,两款模型均为文本输入、文本输出;上下文窗口为 200K,最大输出为 128K 词元 (Token)。

在训练与架构层面, GLM-5 基座参数规模从 355B (激活 32B) 扩展至 744B (激活 40B),预训练数据从 23T 提升至 28.5T;后训练方面引入异步强化学习框架「Slime」与异步智能体强化学习算法;长上下文方面首次集成稀疏注意力机制 (DeepSeek Sparse Attention),以在长文本效果尽量无损的前提下降低部署成本,并提升词元效率 (Token Efficiency)。

在编程与 Agent 评测方面, GLM-5 在 SWE-bench-Verified 获得 77.8 分、在 Terminal Bench 2.0 获得 56.2 分,均为开源模型最高分数,并表示其性能超过 Gemini 3.0 Pro;文档还称其在 BrowseComp、MCP-Atlas 与 τ²-Bench 等基准中取得开源第一,并在内部 Claude Code 评估集合中显著超越 GLM-4.7。

(智谱)
 
 
Back to Top