美国斯坦福大学AI团队抄袭中国大模型核心证据来自2300多年前的清华简

文章来源：都市快报

字体：大中小

发布时间：2024-06-05 17:20:26

《新江南网》江南区域知名综合门户网站！

追踪网络热点，关注民生动态，传播江南文化，倡导网络新时代！

https://www.xjnnet.com/欢迎您！

☆ 新江南网 ☆欢迎您

新江南网欢迎你/www.xjnnet.com/新江南网荣誉出品

美国斯坦福大学一个AI团队主导的开源大模型，被证实套壳抄袭了国内清华系明星创业公司面壁智能的开源模型。目前，该团队已公开道歉，并将该项目在相关平台上的库一并删除。

这一事件昨天在国内外社交媒体上引发热议，#斯坦福抄袭中国大模型#和#斯坦福团队道歉#，当天下午分别冲上微博热搜第2和第5位。

斯坦福大学AI团队

抄袭中国大模型

5月29日，一个来自斯坦福大学的AI团队在网上发表文章《Llama3-V: Matching GPT4-V with a 100x Smaller Model and 500 Dollars》，并开始广而告之：成功训练出一个SOTA多模态模型Llama3-V，性能比GPT4-V、Gemini Ultra、Claude Opus更强，但模型要小100倍，且训练成本仅需500美元（折合人民币约3622元）。后三个大模型，都是全球范围知名的多模态“巨无霸”。

由于团队成员拥有斯坦福大学（其中两人是斯坦福大学本科生）、特斯拉、SpaceX、亚马逊等亮眼背景，Llama3-V第一时间被推到了聚光灯下，登上开发者社区Hugging Face（抱抱脸）首页，引发众多开发者关注。

很快，有用户在Hugging Face以及海外社交平台X上提出质疑：Llama3-V是否套壳MiniCPM-Llama3-V 2.5？后者为面壁智能5月20日推出的开源端侧多模态模型。

舆论迅速发酵。经过一些开发者的比较，两者在模型结构、代码、配置文件等方面完全相同，只是进行了一些重新格式化，并将部分变量重新命名。

面对质疑，斯坦福大学团队一开始选择“辩解”：只是使用了MiniCPM-Llama3-V 2.5的tokenizer（分词器，自然语言处理NLP中的一个关键组件，负责将长篇文本内容拆解成一个个独立的单词或子词），并且宣称在它发布前就已开始这项工作。

两位斯坦福大学学生公开道歉

6月2日晚，面壁智能团队确认抄袭事实。次日，面壁智能首席科学家刘知远在知乎上表示：“已经比较确信Llama3-V是对我们MiniCPM-Llama3-V 2.5套壳。”

他还表示：“人工智能的飞速发展离不开全球算法、数据与模型的开源共享。我们这次开源的MiniCPM-Llama3-V 2.5就用到了最新的Llama3作为语言模型基座。而开源共享的基石是对开源协议的遵守，对其他贡献者的信任，对前人成果的尊重和致敬。”

CEO李大海也在朋友圈发文：“对这件事深表遗憾。一方面感慨这也是一种受到国际团队认可的方式，另一方面呼吁大家共建开放、合作、有信任的社区环境。”

昨天，Llama3-V团队的其中两位成员Aksh Garg（阿克什）和Siddharth Sharma（悉达多），也就是那两位斯坦福大学本科生，已在社交平台上向面壁智能团队道歉：“我们向作者道歉，并对自己没有努力验证这项工作的原创性感到失望。我们对所发生的事情承担全部责任，并已撤下Llama3-V，再次致歉。”

同时，Aksh Garg解释Siddharth Sharma和自己主要是负责推广，编写代码的是Mustafa Aljadery（穆斯塔法），而他目前已经联系不上。

新江南网欢迎你/www.xjnnet.com/新江南网荣誉出品

声明：
本文仅代表作者个人观点，与新江南网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容，新江南网号系信息发布平台，新江南网仅提供信息存储空间服务。如有侵权请出示权属凭证联系管理员（yin040310@sina.com）删除！

上一篇：男生感冒后为不影响中考硬扛一周，结果爆发心肌炎
下一篇：犬伤进入多发期，最高一天接诊150多人有一种病可防不可治，夏季别逗玩陌生动物