一个名为 anonymous-chatbot 的神秘大语言模型出现在 LMSYS 大模型竞技场上,但根据用户反馈,其性能表现出色,在某些任务上甚至超越了当前最先进的模型。
据用户报告,anonymous-chatbot 在多项测试中表现优异,包括成功完成了「草莓测试」和「过河难题」等逻辑推理任务。该模型还能正确回答 9.9 和 9.11 大小比较等需要精确数学计算的问题。另一位用户表示,该模型能够一次性解决所有逻辑测试谜题,展现出强大的问题解决能力。
也有用户反馈,该匿名模型仅擅长推理,而在其他模型能正常表现的常规任务下表现一般。
值得注意的是,OpenAI CEO Sam Altman 在社交平台 X 上发布了一张草莓园的照片,配文「我喜欢花园里的夏天」。这一举动被广泛解读为对传闻已久的 OpenAI 新项目「Strawberry」(草莓)的暗示。尽管 Altman 本人并未直接确认,但这一巧合进一步加剧了人们对 anonymous-chatbot 与 OpenAI 可能存在关联的猜测。