新江南网欢迎你/www.xjnnet.com/新江南网荣誉出品 |
美国斯坦福大学一个AI团队主导的开源大模型,被证实套壳抄袭了国内清华系明星创业公司面壁智能的开源模型。目前,该团队已公开道歉,并将该项目在相关平台上的库一并删除。
这一事件昨天在国内外社交媒体上引发热议,#斯坦福抄袭中国大模型#和#斯坦福团队道歉#,当天下午分别冲上微博热搜第2和第5位。
斯坦福大学AI团队
抄袭中国大模型
5月29日,一个来自斯坦福大学的AI团队在网上发表文章《Llama3-V: Matching GPT4-V with a 100x Smaller Model and 500 Dollars》,并开始广而告之:成功训练出一个SOTA多模态模型Llama3-V,性能比GPT4-V、Gemini Ultra、Claude Opus更强,但模型要小100倍,且训练成本仅需500美元(折合人民币约3622元)。后三个大模型,都是全球范围知名的多模态“巨无霸”。
由于团队成员拥有斯坦福大学(其中两人是斯坦福大学本科生)、特斯拉、SpaceX、亚马逊等亮眼背景,Llama3-V第一时间被推到了聚光灯下,登上开发者社区Hugging Face(抱抱脸)首页,引发众多开发者关注。
很快,有用户在Hugging Face以及海外社交平台X上提出质疑:Llama3-V是否套壳MiniCPM-Llama3-V 2.5?后者为面壁智能5月20日推出的开源端侧多模态模型。
舆论迅速发酵。经过一些开发者的比较,两者在模型结构、代码、配置文件等方面完全相同,只是进行了一些重新格式化,并将部分变量重新命名。
面对质疑,斯坦福大学团队一开始选择“辩解”:只是使用了MiniCPM-Llama3-V 2.5的tokenizer(分词器,自然语言处理NLP中的一个关键组件,负责将长篇文本内容拆解成一个个独立的单词或子词),并且宣称在它发布前就已开始这项工作。
两位斯坦福大学学生公开道歉
6月2日晚,面壁智能团队确认抄袭事实。次日,面壁智能首席科学家刘知远在知乎上表示:“已经比较确信Llama3-V是对我们MiniCPM-Llama3-V 2.5套壳。”
他还表示:“人工智能的飞速发展离不开全球算法、数据与模型的开源共享。我们这次开源的MiniCPM-Llama3-V 2.5就用到了最新的Llama3作为语言模型基座。而开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬。”
CEO李大海也在朋友圈发文:“对这件事深表遗憾。一方面感慨这也是一种受到国际团队认可的方式,另一方面呼吁大家共建开放、合作、有信任的社区环境。”
昨天,Llama3-V团队的其中两位成员Aksh Garg(阿克什)和Siddharth Sharma(悉达多),也就是那两位斯坦福大学本科生,已在社交平台上向面壁智能团队道歉:“我们向作者道歉,并对自己没有努力验证这项工作的原创性感到失望。我们对所发生的事情承担全部责任,并已撤下Llama3-V,再次致歉。”
同时,Aksh Garg解释Siddharth Sharma和自己主要是负责推广,编写代码的是Mustafa Aljadery(穆斯塔法),而他目前已经联系不上。
新江南网欢迎你/www.xjnnet.com/新江南网荣誉出品 |
声明:
本文仅代表作者个人观点,与新江南网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容,新江南网号系信息发布平台,新江南网仅提供信息存储空间服务。如有侵权请出示权属凭证联系管理员(yin040310@sina.com)删除!
阅读推荐
新闻爆料