阿里云发布 Qwen3-Embedding 系列模型

6 月 6 日,通义千问(Qwen)团队正式发布 Qwen3-Embedding 系列模型。该系列模型基于 Qwen3 基础模型训练,支持超过 100 种自然语言及多种编程语言。

该系列模型架构灵活,提供 0.6B、2B、8B 三种参数规模。

训练方面,Embedding 模型采用三阶段训练范式:首先利用超大规模弱监督数据进行对比学习预训练,随后基于高质量标注数据进行监督训练,最后通过模型融合提升整体性能。

Reranker 模型则直接基于高质量标注数据进行监督训练。值得一提的是,Embedding 模型在弱监督阶段通过多任务适配的 Prompt 体系,动态生成大规模弱监督文本对,突破了传统数据获取方式的局限。

Qwen3-Embedding 系列已在 Hugging Face、ModelScope 和 GitHub 平台开源。

通义千问
 
 
Back to Top