重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

畴昔一年，中国大模子一直被贴上「追逐好意思国」的标签，但近日微博小号去哪买，推特上却有东说念主曝出：

好意思国斯坦福大学的一个 AI 团队疑似抄袭、「套壳」一家中国大模子公司的开源效果，模子架构与代码足够换取。雷峰网

公论如故启动发酵，引起了圈内东说念主士的世俗研究。雷峰网

根据 AI 科技驳倒整理，事情的经由约莫如下：

5 月 29 日，斯坦福大学的一个研究团队发布了一个名为「Llama3V」的模子，堪称唯有 500 好意思元（约就是东说念主民币 3650 元）就能历练出一个 SOTA 多模态模子，且效果并列 GPT-4V、Gemini Ultra 与 Claude Opus 。

Github开源：https://github.com/mustafaaljadery/llama3v

HuggingFace开源：https://huggingface.co/mustafaaljadery/llama3v（已删库）

Medium发布著述：https://aksh-garg.medium.com/llama-3v-building-an-open-source-gpt-4v-competitor-in-under-500-7dd8f1f6c9ee

Twitter官宣模子：https://twitter.com/AkshGarg03/status/1795545445516931355

由于该团队的作家（Mustafa Aljaddery、Aksh Garg、Siddharth Sharma）来自斯坦福，又集皆了特斯拉、SpaceX、亚马逊与牛津大学等机构的关系布景阅历，很快该模子发布的推特帖子浏览量就如故朝上 30 万，转发 300+次，并马上冲到了 Hugging Face 首页：

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

但很快，没过几天，推特与 Hugging Face 上就启动出现怀疑的声息，质疑 Llama3V 套壳面壁智能在 5 月中旬发布的 8B 多模态小模子 MiniCPM-Llama3-V 2.5，且莫得在 Llama3V 的职责中抒发任何「请安」或「感谢」 MiniCPM-Llama3-V 2.5 的声息。

对此，Llama3V 团队回复，他们「仅仅使用了 MiniCPM-Llama3-V 2.5 的 tokenizer」，并宣称「在 MiniCPM-Llama3-V 2.5 发布前就启动了这项职责」。

紧接着，6 月 2 日，有网友在 Llama3V 的 Github 技俩下抛出事实性质疑，但很快被 Llama3V 的团队删除。为此，提倡质疑的网友被激愤暴走，跑到了 MiniCPM-V 的 Github 页面进行事件规复，辅导面壁智能团队调整此事。

随后，面壁团队通过测试，发现 Llama3V 与 MiniCPM-Llama3-V 2.5 在「胎记」般案例上的证据 100% 相通，「不仅正确的地点一模一样，连伪善的地点也一模一样」。

至此，推特公论启动发酵，「斯坦福抄袭中国大模子」一事不胫而走。

1、「套壳」把柄实锤，斯坦福团队百口莫辩

最启动，用户质疑 Llama3V 套壳 MiniCPM-Llama3-V 2.5 开源模子时，Llama3V 作家团队并不承认，而是宣称他们仅仅「使用了 MiniCPM-Llama3-V 2.5 的 tokenizer」，并宣称他们「在 MiniCPM-Llama3-V 2.5 发布前就启动了这项职责」：

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

不外，好心网友对 Llama3V 作家团队的酬谢并不买单，而是在 Llama3V 的 Github Issue 上发布了一系列质疑，列举具体 4 点把柄，但很快被 Llama3V 的团队删除。幸好作家预先截了图保留：

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

濒临网友的质疑，Llama3V 作家仅仅就事论事地回复，称他们仅仅使用了 MiniCPM 的树立来惩处 Llama3V 的推理 bug，并称「MiniCPM 的架构是来自 Idéfics，SigLIP也来自 Idéfics，他们也仅仅奴才 Idéfics 的职责」而非 MiniCPM 的职责，因为「MiniCPM 的视觉部分亦然来自 Idéfics 的」——

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

而况将原本 readme 里援用致谢「MiniCPM-Llama3 」改为了「致谢 MiniCPM」：

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

但根据网友的复盘、梳理，Llama3V 并非仅仅神圣的鉴戒，而是有 4 点把柄能充分标明其「套壳」了 MiniCPM-Llama3-V 2.5。

把柄 1：

Llama3V 技俩使用了与 MiniCPM-Llama3-V 2.5 技俩足够换取的模子结构和代码完满。

Llama3-V 的模子结构和树立文献与 MiniCPM-Llama3-V 2.5 足够换取，仅仅变量名不同。

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

图左为 MiniCPM-Llama3-V 2.5，图右为 Llama3V

Llama3-V 的代码是通过对 MiniCPM-Llama3-V 2.5 的代码进行体式调遣和变量重定名获得的，包括但不限于图像切片相貌、tokenizer、重采样器和数据加载：

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

把柄 2：

Llama3V 团队称其「援用了 LLaVA-UHD 行动架构」，但事实是 Llama3V 与 MiniCPM-Llama3-V 2.5 结构足够换取，但在空间格式等多方面却与 LLaVA-UHD 有较大互异。

Llama3-V 具有与 MiniCPM-Llama3V 2.5 换取的美艳器（tokenizer），包括 MiniCPM-Llama3-V 2.5 新界说的迥殊美艳：

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

把柄 3：

Llama3V 作家曾在 Hugging Face 上胜利导入了 MiniCPM-V 的代码，后更名为 Llama3V。事件发酵后，AI 科技驳倒开放 Hugging Face 页面发现如故「404」：

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

https://huggingface.co/mustafaaljadery/llama3v/commit/3bee89259ecac051d5c3e58ab619e3fafef20ea6Llama3V

作家酬谢删除 Hugging Face 仓库的原因是「开辟模子的推理问题」，并称他们「尝试使用 MiniCPM-Llama3 的树立，但并没灵验」：

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

戏剧效果拉满的是，该网友随后贴出了怎么使用 MiniCPM-Llama3-V 的代码，跑通 Llama3V 模子推理的详备体式。

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

当 Llama3V 的作家被筹商怎么能在 MinicPM-Llama3-V2.5 发布之前就使用它的 tokenizer 时（因为其一启动称他们在 MinicPM-Llama3-V2.5 发布前就如故启动了 Llama3V 的研究），Llama3V 的作家启动撒谎，称是从如故发布的上一代 MinicPM-V-2 技俩里拿的tokenizer：

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

但事实是，据 AI 科技驳倒向面壁团队了解，MiniCPM-V-2 的 tokenizer 与 MinicPM-Llama3-V2.5 足够不同，在Huggingface 里是两个文献，「既不是归并个 tokenizer 件，文献大小也足够不同」。

MinicPM-Llama3-v2.5 的 tokenizer 是 Llama3 的 tokenizer 加上 MiniCPM-V 系列模子的一些迥殊 token 构成，MiniCPM-v2 因为在 Llama3 开源之前就发布，是以不会有 Llama3 的 tokenizer ：

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

把柄 4：

Llama3V 的作家删除了 GitHub 上的关系 issue，并似乎不足够意会 MinicPM-Llama3-V2.5 的架构或 Llama3V 我方的代码。

Perceiver重采样器是一个单层的交叉贵重力机制，而不是两层炫夸办法机制。SigLIP 的 Sigmoid 激活函数并未用于历练多模态大型说话模子，而仅用于 SigLIP 的预历练。

但 Llama3V 在论文中的先容却说其遴选了两层炫夸办法机制：

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

而 MiniCPM-Llama3-V 2.5 和 Llama3V 代码如下，体现的却是单层交叉贵重力机制：

Llama3-V：

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

MiniCPM-Llama3-V 2.5：

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

且视觉特征索求不需要激活 sigmoid：

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

2、推特公论发酵，面壁酬谢

6 月 2 日下昼，该事件启动在推特上发酵，MiniCPM-V 的作家切身发帖，默示「惊骇」，因为斯坦福的 Llama3V 模子果真也能识别「清华简」。

昨日，蕾哈娜更是空降上海，不仅是为了参加一场盛大的品牌活动，更是在活动过程中融入中国美食文化，给上海的粉丝们带来了一场别开生面的惊喜——亲手制作煎饼果子！

据 AI 科技驳倒向面壁团队了解，「清华简」是清华大学于 2008 年 7 月储藏的一批战国竹简的简称；识别清华简是 MiniCPM-V 的「胎记」特征。该历练数据的集合和标注均由面壁智能和清华大学当然说话处理现实室团队里面完成，关系数据尚未对外公开。

斯坦福的 Llama3V 模子证据与 MiniCPM-Llama3-V 2.5 检讨点的加噪版块高度相似：

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

以下是面壁团队效果与 Llama3V 对「清华简」的识别对比。适度显现，两个模子不仅正确的地点一模一样、伪善的地点也相通：

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

Q：请识别图像中的竹简字？

MiniCPM-Llama3-V 2.5：民

Llama3-V：民

GT：民

伪善识别示例：

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

Q：请识别图像中的竹简字？

MiniCPM-Llama3-V 2.5：正人

Llama3-V：正人

GT：甬

以下是在 1000 个清华简字体上的识别效果：

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

不错看到，Llama3V 与 MiniCPM-Llama3-V 2.5 的重叠高达 87%，且两个模子的伪善散布律高度相似：Llama3V 的伪善率为 236，MiniCPM-Llama3-V 2.5 的伪善率是 194，两个模子在 182 个伪善识别上换取。

同期，两个模子在清华简上的高斯噪声也相似高度相似：

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵

此外，Llama3V 的 OCR 识别能力在中翰墨上也与 MiniCPM-Llama3-V 2.5 高度相似。对此，面壁团队默示，他们很酷好斯坦福团队是怎么只用「500 好意思元就能历练出这样高妙的模子性能」。

根据公开信息显现，Llama3V 的两位作家 Siddharth Sharma 与 Aksh Garg 是斯坦福大学遐想机系的本科生，曾发表过多篇机器学习领域的论文。

其中，Siddharth Sharma 曾在牛津大学窥察、在亚马逊实习；Aksh Garg 曾经在 SpaceX 实习。

这件事反应出，AI 研究的投契分子不分国家。

同期，也反应出，中国科研团队的开源大模子实力如故冲出洋门，冉冉被越来越多海外驰名的机构与开发者所调整、学习。

中国大模子不仅在追逐寰宇顶尖机构，也正在成为被寰宇顶尖机构学习的对象。

由此可见，今后看客们注视国表里的大模子本领实力对比，应该多一份民族自信、少少许俯首贴耳，将调整度多聚焦在国内的原创本领上。雷峰网(公众号：雷峰网)

终末，一句话追溯：投契弗成取，永争变嫌一。

雷峰网原创著述，未经授权不容转载。细目见转载应知。

เครื่องสล็อต

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果微博小号去哪买，推特公论启动发酵

让建站和SEO变得简单

你的位置：微信公众号账号购买 > 苹果韩国id >

重磅！斯坦福 AI 团队被曝抄袭中国大模子开源效果，推特公论启动发酵 | 雷峰网

热点资讯

相关资讯