阿里云发布 Qwen3-Embedding 系列模型6 月 6 日，通义千问（Qwen）团队正式发布 Qwen3-Embedding 系列模型

阿里云发布 Qwen3-Embedding 系列模型

6 月 6 日，通义千问（Qwen）团队正式发布 Qwen3-Embedding 系列模型。该系列模型基于 Qwen3 基础模型训练，支持超过 100 种自然语言及多种编程语言。

该系列模型架构灵活，提供 0.6B、2B、8B 三种参数规模。

训练方面，Embedding 模型采用三阶段训练范式：首先利用超大规模弱监督数据进行对比学习预训练，随后基于高质量标注数据进行监督训练，最后通过模型融合提升整体性能。

Reranker 模型则直接基于高质量标注数据进行监督训练。值得一提的是，Embedding 模型在弱监督阶段通过多任务适配的 Prompt 体系，动态生成大规模弱监督文本对，突破了传统数据获取方式的局限。

Qwen3-Embedding 系列已在 Hugging Face、ModelScope 和 GitHub 平台开源。

（通义千问）