斯坦福研究团队 Llama3-V 模型涉嫌抄袭

近日,斯坦福大学研究团队发布的 Llama3-V 模型因涉嫌抄袭清华大学和面壁智能合作开发的多模态模型 MiniCPM-Llama3-V 2.5 而引发广泛关注。Llama3-V 模型在发布后迅速走红,但被网友指出其模型结构、代码与分词器几乎完全照搬自 MiniCPM-Llama3-V 2.5,仅做了变量名称和格式上的修改。

事件起因于 Magic Yang 等用户在 GitHub 项目和 HuggingFace 项目页面中提出质疑,指出 Llama3-V 项目大量抄袭 MiniCPM-Llama3-V 2.5 的代码和配置文件。面对质疑,Llama3-V 的作者删除了相关讨论帖和项目库,并隐藏了 HuggingFace 项目页面。

Magic Yang 进一步指出,Llama3-V 模型使用了 MiniCPM-Llama3-V 2.5 分词器,其架构与 MiniCPM-Llama3-V 2.5 相同,连 MiniCPM-Llama3-V 2.5 新定义的特殊符号都被抄袭。对此,Llama3-V 的作者解释称,他们借鉴了 LLaVA-UHD 的架构,并使用了 MiniCPM-V-2 的分词器,但该解释被指出有明显时间错位和逻辑漏洞。

在外界质疑声中,Llama3-V 的 GitHub 和 HuggingFace 项目均显示为「404」或私密状态,斯坦福大学方面尚未对此事做出正式回应。

(彩虹之眼)
 
 
Back to Top