被曝“抄袭”中国大模型,斯坦福AI团队道歉:1人失联2人甩锅,还被扒出“抄袭前科”​!...

feb492fce35072d931f9b28c97d0d677.gif

整理 | 郑丽媛

出品 | 程序人生(ID:coder_life)

近日闹得沸沸扬扬的“斯坦福 AI 团队抄袭中国大模型”事件,终于在今天凌晨迎来了结局:Llama3-V 团队的两位作者在 X 上承认抄袭并道歉,并表示会把 Llama3-V 模型撤下。

9b89994f99cbb89ee79dcf4c60cdc952.png

5e6e965cba8a3f9e10d8e0e58108d5ec.png

若不太了解事件前情,可具体查看《中国大模型遭抄袭,斯坦福 AI 团队“删库跑路”!》。以下为懒人省流版:

(1)事件起源于 5 月 29日,一个斯坦福 AI 团队称其主导开发的 Llama 3-V 模型是一个超越 GPT-4V 的 SOTA 多模态大模型,且只需 500 美元就能训练出来。

(2)随后一位名为 pzx163 的用户发现,Llama 3-V 使用的模型结构和代码,与面壁智能在 5 月 21 日开源的端侧多模态模型 MiniCPM-Llama3-V 2.5 高度相似,仅修改了部分变量名。

dbede0133df68f08faaa8d6cfa220777.png

(3)禁不住 pzx163 的连环质问,Llama3-V 团队的回应几乎漏洞百出,发现实在圆不回来后,直接把 pzx163 质疑抄袭的提问全删了,并在 HuggingFace 和 GitHub 上把项目“紧急删库”。

724f6b296d704669111562979b1b2b96.png

然而事实证明:逃避解决不了问题。

160cf738aa14d51fc4ac23d6ce8cf9d8.png

斯坦福 AI Lab 主任下场开骂

此事件经过不断发酵后,国内外多位知名技术人对此表示“深表遗憾”,斯坦福 AI 实验室主任 Christopher Manning 更是直接在 X 上骂道:“这就是不肯承认自己的错误!

9413226ad99bba7ff5a65d50673a84c3.png

在这句话后,Christopher Manning 对 MiniCPM 这一中国开源模型表示赞扬,另外还附上了 Llama3-V 团队被发现抄袭后,在 Medium 官宣文中更新的一段话(目前该文已删除):

“非常感谢在评论中指出与之前研究相似之处的人。我们意识到我们的架构与 OpenBMB 的“MiniCPM-Llama3-V 2.5:手机上的 GPT-4V 级多模态 LLM”非常相似,他们在实现方面领先于我们。为了尊重作者,我们删除了原始模型。”

显然,虽然多了这段声明,但事实上 Llama3-V 团队并没有明确承认自己的抄袭行为,仅用“架构非常相似”、“他们在实现方面领先于我们”这类模棱两可的说法作为回应。

或许是问责的声音太过庞大,今日凌晨 Llama3-V 三位作者中的两位:Aksh Garg 和 Siddharth Sharma 在 X 上对此事正式道歉并承认抄袭——不过言语之中,“甩锅”给第三位作者 Mustafa Aljadery 的嫌疑很大

e8bb1264cf2689201cff60bd78a5465b.png

道歉声明,实际上是为了甩锅?

从内容上来看,Aksh Garg 和 Siddharth Sharma 两人的道歉声明几乎一致——其实在此之前,Aksh Garg 就曾发布过一则相似内容的道歉声明,但不知为何被迅速删除了。

对比删除版本,Aksh Garg 正式发布的道歉声明不同之处主要有 4 处:

(1)原版:“我们俩(Aksh 和 Siddharth)都忙于自己的全职工作,所以 Mustafa 为该项目编写了所有代码。”➡️更新版:“Mustafa 编写了该项目的代码。”

(2)原版:“在看到这些指控后,我们与 Mustafa 讨论了 Llama3V 的原创性证明,并要求提供训练代码,但到目前为止还没有看到任何证据。”➡️更新版:“我们希望 Mustafa 能发表原创声明,但从昨天开始就一直无法联系到他。”

(3)原版:“在盲目信任队友之前,重要的是要根据先前的经验验证一切,但我们在这方面失败了。”➡️更新版:“我们有责任将我们的工作与过去的研究进行比对,但我们没有做到这一点。”

(4)原版:“所以我们帮他(Mustafa)在 Medium和 Twitter 上推广该项目。”➡️更新版:“因此,我们俩在这个项目中的角色是帮他(Mustafa)在媒体和 twitter 上推广这个模型。”

以下为 Aksh Garg 最新发布的道歉声明全文:

首先,我们要向 MiniCPM 的原作者道歉。我们希望 Mustafa 能发表原创声明,但从昨天开始就一直无法联系到他。

Siddharth 和我与 Mustafa 一起发布了 Llama3V。Mustafa 编写了该项目的代码。Sid 和我都对多模态模型非常感兴趣,也很喜欢他(Mustafa)向我们描述的在 Idefics、SigLip 和 UHD 基础上的架构扩展。因此,我们俩在这个项目中的角色是帮助他在媒体和 twitter 上推广这个模型。Sid 和我查阅了最近的论文以验证这项工作的新颖性,但我们并不知道也不了解 @OpenBMB 之前的任何工作。

我们向作者表示歉意,并对自己没有尽职验证这项工作的原创性感到非常失望。我们有责任将我们的工作与过去的研究进行比对,但我们没有做到这一点,因此我们对所发生的一切负全部责任。今后,@siddrrsh 和我会更加谨慎和勤奋,我们衷心感谢社区提请我们注意此事。为了尊重原作,我们已经删除了所有对 Llama3V 的引用,并再次表示歉意。

- Aksh 和 Siddharth

e587236752ab024fc516b5cfe3c5f650.png

截至目前,Aksh Garg 和 Siddharth Sharma 已发布声明,但他们所说的“编写了项目代码”主要作者 Mustafa Aljadery 至今没有回应,甚至他的 X 账号也已是锁定状态,无法查看任何推文。

a128d70b504168208526518294212df9.png

与此同时,通过 Aksh 和 Siddharth 新发布的这份道歉声明,也让许多网友发现了另一个问题:按这说法,敢情你俩啥也没干、搞个宣传工作就成项目作者了?

  • “(宣发时)你说这是你们三个人共同建造的,为啥现在只把一个人推出来?”

bb3db903d13fa527d2706eec40d07457.png

  • “这仍然反映了你们两个人的劣迹。你们之前声称自己是作者,随后炒作自己的东西,可实际上:1.完全没有参与开发;2.根本不知道它是怎么做出来的。到了现在,你们还把朋友完全推到了风口浪尖上。”

  • “你们本想把开发模型的功劳揽到自己身上,现在出事了又想推卸责任,这也太不地道了吧。”

77c3f23562c6f2b9cea6db5cf4f9d6f4.png

一群抄袭惯犯?

不知该说是意外还是意料之中,很快有网友发现这个团队似乎有“抄袭”前科。

目前处于失联状态的 Mustafa Aljadery 曾写过一本关于“计算机网络设计”的书,有网友随机抽取了其中一章并用抄袭检测器刷了一遍,结果显示:“我们在你的文章中发现了抄袭行为,还发现了 71 处写作问题。”

57258c4e8c7b44587c4930d17458454b.jpeg

据悉,该书的作者栏里也有 Siddharth 的名字——不过具体情况如何已不得而知了,因为这本书目前也已经被删了。

不论如何,这件事情似乎已到此为止:抄袭者承认并道歉,抄袭模型也全部下架。最后,引用面壁智能创始人刘知远的一句回应,作为对开源未来的期许:

“人工智能的飞速发展离不开全球算法、数据与模型的开源共享,让人们始终可以站在 SOTA 的肩上持续前进。而开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬。”

参考链接:

https://x.com/chrmanning/status/1797664513367630101

https://x.com/siddrrsh/status/1797682242145464814

推荐阅读:

▶微软也“扶不起”的Win11!明年退役的Win10市占率再涨,网友:不如专心搞Win12吧

▶“现在,仅需两行代码,就能窃取你在 Windows PC 上输入/查看的所有内容!”

▶仅 7 人的公司,年收 100 万美元!但从谷歌辞职的老板决定:以 60 万美元,卖掉

65b56d89963397fa16f83f38a0636054.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值