新神秘模型现身LMSYS 大模型竞技场近日,AI 爱好者在 LMSYS Chatbot Arena 大模型竞技场上发现了两个新模型,名为"im-also-a-late-june-chatbot"和"late-june-chatbot"

一个小站的自留地

疑似是 OpenAI 新模型的未知模型出现在大模型竞技场 LMSYS 上一个名为 gpt2-chatbot 的大模型于不久前出现在大模型竞技场 LMSYS 上，尽管基准测试分数不被公开，但根据网友的实测，其性能超过目前市面上的所有大语言模型。通过提示词引导和基于 token 分词器的研究发现， gpt2-chatbot 非常有可能来自 OpenAI，且应该是 GPT-4 的一个改进版本。其在逻辑能力、代码能力和数学能力上具有当今其他任何大模型无法比拟的能力。似乎很有可能,这个神秘模型实际上是GPT…

新神秘模型现身LMSYS 大模型竞技场

近日,AI 爱好者在 LMSYS Chatbot Arena 大模型竞技场上发现了两个新模型,名为"im-also-a-late-june-chatbot"和"late-june-chatbot"。这两个模型仅在平台的随机对战模式中出现,尚未被列入直接聊天的可选列表。

多位用户在与模型交互后发现，当被问及身份时，这两个模型均自称是 Google 的 Gemma。考虑到模型的表现和命名方式，社区普遍推测这可能是 Gemma 2 的预览版本。然而，由于模型有时会产生幻觉，这一说法尚未得到确认。

据测试者反馈,这些新模型在某些任务上的表现优于 Claude 3 Haiku。它们倾向于使用粗体和项目符号列表来组织输出,显示出独特的风格特征。有用户推测这可能是 Gemma 的两种不同尺寸或微调版本。但也有用户指出，在一些基准测试中，特别是英语问题的处理上，新模型的表现不如 Llama 3 70B。

值得注意的是，这两个模型的命名方式与 OpenAI 此前在同一平台上测试新模型时使用的方式相似，这引发了猜测。有人认为这可能是 Google 对 OpenAI 此前行为的模仿或调侃，也有人怀疑这可能是其他公司的障眼法。

目前尚不清楚 Google 是否正在借助 LMSYS Chatbot Arena 大模型竞技场对 Gemma 模型进行实际应用测试。鉴于 AI 领域的激烈竞争,各大公司纷纷推出新模型以保持技术优势,Google 此举或为应对 OpenAI、Anthropic 等竞争对手的最新进展。

（Reddit）