一个小站的自留地
DeepSeek 启用上下文硬盘缓存技术,大模型的价格再降低一个数量级 8 月 2 日起, DeepSeek API 将默认启用上下文硬盘缓存技术,把预计未来会重复使用的内容,缓存在分布式的硬盘阵列中。如果输入存在重复,则重复的部分只需要从缓存读取,无需计算。该技术不仅降低服务的延迟,还大幅削减最终的使用成本。 缓存命中的部分,DeepSeek 费用为 0.1元 /百万 tokens。至此,大模型的价格再降低一个数量级。 硬盘缓存服务已经全面上线,用户无需修改代码,无需更换接口,硬盘缓存服务将自动运…
DeepSeek-V2.5-0905 发布,文理模型合二为一

DeepSeek 对旗下模型进行了重大更新。具体变动包括 deepseek-coder 模型正式下线,以及 deepseek-chat 模型升级至 DeepSeek-V2.5-0905 版本。

新版模型DeepSeek-V2.5-0905 在与 GPT-4 的对战中表现出色, 在写作任务、指令跟随和拒答表现等方面也得到了优化,代码生成能力已达到 DeepSeek-Coder-V2-0724 的水平。

官方表示,deepseek-chat 模型已升级为 DeepSeek-V2.5-0905,接口保持不变;而deepseek-coder 模型已下线,相关调用会转发到 deepseek-chat。

DeepSeek
 
 
Back to Top