近日,推特上有人曝出美国斯坦福大学的一个AI团队疑似抄袭、「套壳」一家中国大模型公司的开源成果,模型架构与代码完全相同。
据悉,5月29日,斯坦福大学的一个研究团队发布了一个名为「Llama3V」的模型,号称只要500美元(约等于人民币3650元)就能训练出一个SOTA多模态模型,且效果比肩GPT-4V、Gemini Ultra与Claude Opus 。
由于Llama3-V的3位作者拥有名校头衔加持,又有特斯拉、SpaceX的大厂相关背景,这个项目短短几天就受到了关注。
但很快推特与Hugging Face上就开始出现怀疑的声音,质疑Llama3V套壳面壁智能在5月中旬发布的8B多模态小模型MiniCPM-Llama3-V 2.5,且没有在Llama3V的工作中表达任何「致敬」或「感谢」 MiniCPM-Llama3-V 2.5的声音。
对此,Llama3V 团队回复,他们“只是使用了MiniCPM-Llama3-V 2.5的tokenizer”,并宣称“在MiniCPM-Llama3-V 2.5发布前就开始了这项工作”。但有网友在Llama3V的Github项目下抛出事实性质疑,却很快被Llama3V的团队删除。
为此,提出质疑的网友在MiniCPM-V的Github页面进行事件还原,提醒面壁智能团队关注此事。目前,该斯坦福团队成员已删除他们在上官宣模型的推文,并将该项目在Github和HuggingFace上的库一并删除。
随后,面壁团队通过测试 ,发现Llama3V与MiniCPM-Llama3-V 2.5在「胎记」般案例上的表现100%雷同,“不仅正确的地方一模一样,连错误的地方也一模一样”。面壁智能CEO李大海也做出了正式回应:“技术创新不易,每一项工作都是团队夜以继日的奋斗结果。我们希望团队的好工作被更多人关注与认可,但不是以这种方式。”
扫一扫
在手机上阅读