近日,AI 爱好者在 LMSYS Chatbot Arena 大模型竞技场上发现了两个新模型,名为"im-also-a-late-june-chatbot"和"late-june-chatbot"。这两个模型仅在平台的随机对战模式中出现,尚未被列入直接聊天的可选列表。
多位用户在与模型交互后发现,当被问及身份时,这两个模型均自称是 Google 的 Gemma。考虑到模型的表现和命名方式,社区普遍推测这可能是 Gemma 2 的预览版本。然而,由于模型有时会产生幻觉,这一说法尚未得到确认。
据测试者反馈,这些新模型在某些任务上的表现优于 Claude 3 Haiku。它们倾向于使用粗体和项目符号列表来组织输出,显示出独特的风格特征。有用户推测这可能是 Gemma 的两种不同尺寸或微调版本。但也有用户指出,在一些基准测试中,特别是英语问题的处理上,新模型的表现不如 Llama 3 70B。
值得注意的是,这两个模型的命名方式与 OpenAI 此前在同一平台上测试新模型时使用的方式相似,这引发了猜测。有人认为这可能是 Google 对 OpenAI 此前行为的模仿或调侃,也有人怀疑这可能是其他公司的障眼法。
目前尚不清楚 Google 是否正在借助 LMSYS Chatbot Arena 大模型竞技场对 Gemma 模型进行实际应用测试。鉴于 AI 领域的激烈竞争,各大公司纷纷推出新模型以保持技术优势,Google 此举或为应对 OpenAI、Anthropic 等竞争对手的最新进展。
(Reddit)