一个小站的自留地
微软发布 Phi-3.5 系列模型,性能超越同规模模型

微软近日推出了新一代人工智能模型系列 Phi-3.5,包括 Phi-3.5-MoE-instruct、Phi-3.5-mini-instruct 和 Phi-3.5-vision-instruct 三款模型。这一系列模型旨在满足从基础推理到复杂推理及多模态任务等多种 AI 应用需求。

- Phi-3.5 Mini Instruct 是一款轻量级 AI 解决方案,专为计算资源有限的场景设计。尽管参数量仅为 3.8 亿,该模型仍能处理代码生成、数学问题解决及逻辑推理等复杂任务。它支持 128k 的词元上下文长度,能有效管理长时间交互,并在多语言和多轮对话任务中表现优异。

- Phi-3.5 MoE是微软首次尝试的专家混合(Mixture of Experts)模型,将多种模型类型结合为一。该模型总计拥有 420 亿个参数,在任何给定时间内激活 66 亿个参数,确保高效性能。Phi-3.5 MoE 在代码、数学及多语言理解等领域表现出色,在一些基准测试中超过了 GPT-4 等更大模型。

- Phi-3.5 Vision Instruct 专注于需要文本与图像处理能力的任务。这款模型在通用图像理解、光学字符识别、图表与表格理解以及视频摘要等领域表现突出。与其他两款模型相同,Vision Instruct 也支持 128k 的词元上下文长度,能够处理复杂的多帧视觉任务。

微软将所有三款 Phi-3.5 模型以 MIT 许可证形式开源发布,允许开发者自由使用、修改和分发这些模型。据报道,这些模型在多个基准测试中表现出色,超越了谷歌和 Meta 的同类模型,为用户提供了更强的推理和多模态任务支持。

据 Reddit 用户讨论,Phi-3.5 是目前最「安全」的模型之一,在安全性和有效性方面表现突出。微软声称,Phi-3.5 系列能够有效防止生成冒犯性内容。
 
 
Back to Top