深度求索 19 日晚发布消息，DeepSeek 线上模型版本已升级至 V3.1，上下文长度拓展至 128k，欢迎前往官方网页、APP、小程序测试，API 接口调用方式保持不变

一个小站的自留地

深度求索 28 日发布消息，DeepSeek R1 模型已完成小版本试升级，API 接口和使用方式保持不变。

深度求索 19 日晚发布消息，DeepSeek 线上模型版本已升级至 V3.1，上下文长度拓展至 128k，欢迎前往官方网页、APP、小程序测试，API 接口调用方式保持不变。

21 日，DeepSeek 正式发布 DeepSeek-V3.1 模型。此次更新引入了混合推理架构，将模型分为「非思考模式」与「思考模式」，旨在兼顾日常问答的效率与复杂任务的深度推理能力。

DeepSeek V3.1 的核心亮点包括：

- 混合推理架构：模型提供 deepseek-chat (非思考模式) 和 deepseek-reasoner (思考模式) 两种接口。其中，用于深度思考的 V3.1-Think 在性能与上一代 R1-0528 持平的情况下，可节省 20% 至 50% 的词元 (Token) 消耗。而非思考模式也优化了输出长度，解决了先前版本过于「话唠」的问题。

- 增强的智能体 (Agent) 能力：新模型在工具调用和智能体任务方面获得显著提升。根据官方数据，V3.1 在编程智能体测评 SWE-bench 和命令行终端测评 Terminal-Bench 中的准确率近乎翻倍，在多步推理的复杂搜索测试 browsecomp 中，准确率从 8.9% 大幅提升至 30%。

- API 升级与价格调整：API 的上下文长度从 64K 扩展至 128K，并为函数调用 (Function Calling) 加入了严格模式检查。定价模式统一为每百万输入词元 4 元，输出词元 12 元，并取消了夜间优惠，新价格将于北京时间 2025 年 9 月 6 日零点生效。

- 模型开源：V3.1 的 Base 模型在 V3 基础上额外训练了 840B 词元，并与后训练模型均已在 Hugging Face 和魔搭社区开源。需要注意的是，新模型的分词器和聊天模板不兼容旧版本。

此次更新被官方称为「迈向 Agent 时代的第一步」，网页端和 App 的「深度思考」功能也已同步升级。