21 日,DeepSeek 正式发布 DeepSeek-V3.1 模型。此次更新引入了混合推理架构,将模型分为「非思考模式」与「思考模式」,旨在兼顾日常问答的效率与复杂任务的深度推理能力。
DeepSeek V3.1 的核心亮点包括:
- 混合推理架构:模型提供 deepseek-chat (非思考模式) 和 deepseek-reasoner (思考模式) 两种接口。其中,用于深度思考的 V3.1-Think 在性能与上一代 R1-0528 持平的情况下,可节省 20% 至 50% 的词元 (Token) 消耗。而非思考模式也优化了输出长度,解决了先前版本过于「话唠」的问题。
- 增强的智能体 (Agent) 能力:新模型在工具调用和智能体任务方面获得显著提升。根据官方数据,V3.1 在编程智能体测评 SWE-bench 和命令行终端测评 Terminal-Bench 中的准确率近乎翻倍,在多步推理的复杂搜索测试 browsecomp 中,准确率从 8.9% 大幅提升至 30%。
- API 升级与价格调整:API 的上下文长度从 64K 扩展至 128K,并为函数调用 (Function Calling) 加入了严格模式检查。定价模式统一为每百万输入词元 4 元,输出词元 12 元,并取消了夜间优惠,新价格将于北京时间 2025 年 9 月 6 日零点生效。
- 模型开源:V3.1 的 Base 模型在 V3 基础上额外训练了 840B 词元,并与后训练模型均已在 Hugging Face 和魔搭社区开源。需要注意的是,新模型的分词器和聊天模板不兼容旧版本。
此次更新被官方称为「迈向 Agent 时代的第一步」,网页端和 App 的「深度思考」功能也已同步升级。