据 The Information 报道,Meta 计划于 2024 年 7 月 23 日发布其最大规模的 Llama 3 模型。这一版本拥有 4050 亿个参数,不仅能处理文本,还具备理解和生成图像的多模态能力。
(The Information)
此前(7 月 1 日)本频曾提到 Meta 正在 WhatsApp 上进行测试 Llama 3-405B 模型,并可能于近期向公众开放。
社区普遍认为,根据 Meta 此前提供的模型基准测试,该模型如果确实拥有多模态能力,且拥有如此庞大的参数量,性能将有望位于 GPT-4-Turbo 和 GPT-4o 之间,成为「改变开源模型游戏规则」的存在。
——————
与此同时,有小道消息称,Google 计划在今年内公布Gemini 1.5 Ultra 模型,以应对Claude 3.5 Sonnet 的挑战。Gemini 更新日志页面代码 显示,7 月 15 和 18 日将分别有一次更新。
至于 OpenAI, 据路透社报道,OpenAI 正在秘密开发一项代号为「Strawberry」的新 AI 技术,旨在显著提升 AI 模型的推理能力。
该项目被认为是去年引发关注的 Q* 项目的延续。「Strawberry」的目标是让 AI 不仅能生成答案,还能提前计划并自主可靠地浏览互联网进行「深度研究」。这一能力目前尚未被任何 AI 模型实现。
消息人士透露,「Strawberry」采用了一种特殊的「后训练」方法,在大规模预训练后对模型进行进一步优化。这种方法类似于斯坦福大学 2022 年开发的「自我教导推理者」(STaR) 技术。
OpenAI 希望通过「Strawberry」实现长时间任务处理,并计划测试其在软件和机器学习工程领域的应用能力。
对于「Strawberry」的相关问询,OpenAI 发言人表示:「我们希望 AI 模型能像人类一样理解世界。持续研究新的 AI 能力是行业常态,我们相信这些系统的推理能力会随时间改善。」
目前「Strawberry」的具体工作原理仍处于保密状态,其公开发布时间也未确定。但业内普遍认为,这一项目可能代表了 AI 推理能力的重要突破。