DeepSeek 发布了 DeepSeek-V3.2-Exp 模型。新版本引入了稀疏注意力机制 (DSA),旨在提升长文本的训练与推理效率。据官方介绍,其表现与 V3.1-Terminus 版本基本持平。
本次更新已同步覆盖官方 App、网页端及小程序。同时,此次更新也为开发者带来了福利,API 成本直降 50%,即刻生效。
目前,DeepSeek-V3.2-Exp 模型已在 HuggingFace、ModelScope 平台开源,相关技术论文也已同步公开。
(DeepSeek)
——————
据赛博禅心,智谱也即将发布GLM-4.6。
另有传言称,OpenAI 和 Google Gemini 都将于十月上旬发布模型更新。