美国斯坦福大学AI团队抄袭中国大模型核心证据来自2300多年前的清华简

2024-06-05　 A+ A-

《新江南网》江南区域知名综合门户网站！

追踪网络热点，关注民生动态，传播江南文化，倡导网络新时代！

https://www.xjnnet.com/新江南网欢迎您！

美国斯坦福大学一个AI团队主导的开源大模型，被证实套壳抄袭了国内清华系明星创业公司面壁智能的开源模型。目前，该团队已公开道歉，并将该项目在相关平台上的库一并删除。

这一事件昨天在国内外社交媒体上引发热议，#斯坦福抄袭中国大模型#和#斯坦福团队道歉#，当天下午分别冲上微博热搜第2和第5位。

斯坦福大学AI团队

抄袭中国大模型

5月29日，一个来自斯坦福大学的AI团队在网上发表文章《Llama3-V: Matching GPT4-V with a 100x Smaller Model and 500 Dollars》，并开始广而告之：成功训练出一个SOTA多模态模型Llama3-V，性能比GPT4-V、Gemini Ultra、Claude Opus更强，但模型要小100倍，且训练成本仅需500美元（折合人民币约3622元）。后三个大模型，都是全球范围知名的多模态“巨无霸”。

由于团队成员拥有斯坦福大学（其中两人是斯坦福大学本科生）、特斯拉、SpaceX、亚马逊等亮眼背景，Llama3-V第一时间被推到了聚光灯下，登上开发者社区Hugging Face（抱抱脸）首页，引发众多开发者关注。

很快，有用户在Hugging Face以及海外社交平台X上提出质疑：Llama3-V是否套壳MiniCPM-Llama3-V 2.5？后者为面壁智能5月20日推出的开源端侧多模态模型。

舆论迅速发酵。经过一些开发者的比较，两者在模型结构、代码、配置文件等方面完全相同，只是进行了一些重新格式化，并将部分变量重新命名。

面对质疑，斯坦福大学团队一开始选择“辩解”：只是使用了MiniCPM-Llama3-V 2.5的tokenizer（分词器，自然语言处理NLP中的一个关键组件，负责将长篇文本内容拆解成一个个独立的单词或子词），并且宣称在它发布前就已开始这项工作。

两位斯坦福大学学生公开道歉

6月2日晚，面壁智能团队确认抄袭事实。次日，面壁智能首席科学家刘知远在知乎上表示：“已经比较确信Llama3-V是对我们MiniCPM-Llama3-V 2.5套壳。”

他还表示：“人工智能的飞速发展离不开全球算法、数据与模型的开源共享。我们这次开源的MiniCPM-Llama3-V 2.5就用到了最新的Llama3作为语言模型基座。而开源共享的基石是对开源协议的遵守，对其他贡献者的信任，对前人成果的尊重和致敬。”

CEO李大海也在朋友圈发文：“对这件事深表遗憾。一方面感慨这也是一种受到国际团队认可的方式，另一方面呼吁大家共建开放、合作、有信任的社区环境。”

昨天，Llama3-V团队的其中两位成员Aksh Garg（阿克什）和Siddharth Sharma（悉达多），也就是那两位斯坦福大学本科生，已在社交平台上向面壁智能团队道歉：“我们向作者道歉，并对自己没有努力验证这项工作的原创性感到失望。我们对所发生的事情承担全部责任，并已撤下Llama3-V，再次致歉。”

同时，Aksh Garg解释Siddharth Sharma和自己主要是负责推广，编写代码的是Mustafa Aljadery（穆斯塔法），而他目前已经联系不上。

网站声明：
本文仅代表作者个人观点，与新江南网无关。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容，新江南网号系信息发布平台，新江南网仅提供信息存储空间服务。如有侵权请出示权属凭证联系管理员（yin040310@sina.com）删除！

美国斯坦福大学AI团队抄袭中国大模型核心证据来自2300多年前的清华简

台风“巴威”逼近浙江严阵以待筑牢安全防线

“巴威”来袭，民航、铁路、地铁、公交调整信息一览

今年以来最强台风“巴威”逼近浙江各地争分夺秒抢收护粮

全力以赴打好防台遭遇战攻坚战

“巴威”来袭，浙江全省“顶格防御”

浙江湖州：构建新型客户关系赋能产业共创绿色价值

今日浙北部分地区有中到大雨、局部暴雨

从一碗鱼汤到一池鱼跃

嘉兴南湖机场牵手宁波舟山港

浙江嘉兴：新装置投运提升区域迎峰度夏供电质量

“五常阿勒泰”花海限时返场向日葵新景引市民打卡

浙江高校本科专业“上新”了

浙商累计落地“万企兴万村”帮扶项目5368个

记者探访我省高考评卷现场—— 封闭式管理 “背靠背”打分

浙江金华：智慧电力赋能中药材焕发新生机

浙江全面推进“多田套合”农用地布局优化改革

浙BA奖牌奖杯正式亮相，点击揭秘

冲击20℃+，未来三天气温持续拉升

春运首日，浙江各地出行客流较平时略增

衢州打造企业全过程全周期服务体系

美国斯坦福大学AI团队抄袭中国大模型 核心证据来自2300多年前的清华简

美国斯坦福大学AI团队抄袭中国大模型核心证据来自2300多年前的清华简