2026 年 6 月 30 日,LongCat-2.0 正式发布并开源。这是一个总参数量达 1.6 万亿、每个词元 (Token) 激活约 480 亿参数的混合专家 (MoE) 语言模型。该模型的预训练和部署全部在由 5 万余张国产算力芯片组成的集群上完成,耗时一个多月,处理了超过 35 万亿词元,全程无回滚,验证了国产算力平台进行前沿级大规模模型训练的可靠性。
在架构层面,LongCat-2.0 引入了 LongCat 稀疏注意力 (LSA) 机制。该机制通过流感知索引、跨层索引和层级化索引等效率优化策略,在无损模型质量的前提下显著加速了长上下文的处理。同时,模型包含 1350 亿参数的 N-gram Embedding 模块,将词嵌入 (Embedding) 空间扩展了超过 100 倍,以更充分地建模局部上下文信息并提升参数利用率。
在模型能力与后训练方面,LongCat-2.0 基于多教师在线蒸馏 (MOPD) 架构,划分了智能体 (Agent) 能力、推理能力和交互体验三大专家组。评测结果显示,其在百万上下文长度数据处理、代码理解、仓库级修改以及自动化任务执行等场景中表现强劲,核心指标与 Gemini 3.1 Pro 及 GPT-5.5 等领先闭源模型相当。
(longcat.chat)