% P5 ~$ @2 `- C8 B' s5 l! P 4日记者尝试联系率先发现清华系模型被套壳的网友,他表示只是做了一名开源社区工作者应该做的事。此次Llama3-V的抄袭行为,“相当于把可口可乐换成可日可乐就说是自己的项目”。2 b- z& [: u9 k+ K! R; s
, u0 G8 X6 H: K8 n9 A. v
针对此事,面壁智能CEO李大海也作出回应,称技术创新不易,呼吁共建开放、合作、有信任的社区环境。, U2 Q; I8 n$ a; X
$ H. t5 v. T7 A9 z: a, X 用不到500美元训练出超越SOTA水平的大模型? ) ~5 {: I+ E9 }! J& j2 @) [. i y3 L0 {& q5 ? r1 @4 ^ 事情起源于5月29日,斯坦福大学AI团队发布Llama3-V开源模型,称它比当前开源SOTA视觉语言模型LLaVA的性能提高了10%-20%,不仅尺寸比GPT-4V小近100倍,而且性能比肩GPT-4V、Gemini Ultra与Claude Opus。
Llama3-V团队声称训练出一个超越SOTA(意为“最新技术”的最佳状态)水平的多模态大型模型,性能比肩多家。' |) ?4 l- m% z w+ W4 f
3 `* P# f- K0 z$ ?9 |# W: ~7 Y
更重要的是,该大模型的训练成本仅不到500美元。这一惊艳的成果,再加上三位作者出色的专业和技术研发背景,让Llama3-V一经发布就引发各方关注,并一度登上全球最大的开源大模型社区HuggingFace趋势榜第五位。: e# {) q# k% _3 @1 m3 t
3 a' L/ a2 @5 }4 x 不过很快,质疑声便出现。6月2日下午,网友Magic Yang称发现了一个“令人震惊”的事实:Llama3-V项目中有大量疑似抄袭MiniCPM-Llama3-V 2.5的内容,同时晒出了多项Llama3-V涉嫌抄袭的证据。; \; e3 C2 p7 a I# ~3 s
网友晒出Llama3-V涉嫌抄袭的证据。1 [* ?: f$ O0 X; ^8 h! w6 ~: X5 K
GitHub项目信息显示,MiniCPM-Llama3-V2.5共有8B个参数,整体性能超越GPT-4V-1106、Gemini Pro、Qwen-VL-Max和Claude3等专有模型,配备了增强的OCR和指令跟踪能力,还可以支持英语、中文、法语等30多种语言的多模态对话。这款端测多模态开源模型,由清华大学自然语言处理实验室与面壁智能合作开发,于今年5月20日推出。1 k$ C/ l. G3 S
: Z7 H7 F7 W! ?& z8 M
南都记者尝试联系这位揭露Llama3-V涉嫌抄袭的网友Magic Yang(知乎网名“社恐患者杨老师”),他向南都记者回顾了这场打假的过程。杨老师表示,最近正在帮助一名博士生做有关运动处方的项目,想选择一个质量较好的开源模型作为微调的基座。此前他曾测试了MiniCPM-Llama3-V2.5,因此对MiniCPM的模型架构和代码都相对熟悉。 + ^0 m$ ]; T$ H6 X3 X 6 {7 J2 i1 B6 b( s( U. N 后来他注意到,Llama3-V项目在HuggingFace上排名也非常靠前,且获得了相关博主推荐,于是想进一步做测试。但在这过程中,他发现二者在模型架构和代码上存在高度相似的情况,就此询问了Llama3-V作者。结果对方避重就轻,并不正面回应,随后更是将质疑帖子删除,且隐藏了MiniCPM-Llama3-V 2.5的项目主页。( W9 Q, n* M! k* N2 F0 d" ^
) d( X2 ]7 K- ?( J 这一系列的操作,令人生疑。6月2日下午,杨老师把所知的证据发到MiniCPM-V的Github项目主页,并提醒面壁智能团队关注。相关对话截图显示,Llama3-V项目作者最初否认抄袭,并称他们的项目开始时间更早,只是使用了MiniCPM-V2的分词器。 $ x b: { ^" {+ D) W
7 F9 N8 N; q* u, B/ i 杨老师告诉南都记者,作为一个有大模型经验的开发者,发现(抄袭行为)不难,但要证实不易。此事最终一锤定音,还是因为面壁智能团队使用内部数据集“清华简”做了对比测试。 * }7 E* i. Z0 g+ U / u) v+ \5 J" t9 j4 s$ x “连错的都一模一样”,确信是套壳1 a$ K- Q6 B& a* M8 E0 o0 V
/ q' S( P1 `0 m6 J1 s 南都记者注意到,6月2日深夜,面壁智能团队证实了抄袭行为的存在。经核实,除了社区网友列出的证据外,还发现Llama3-V项目与MiniCP-Llama3-V 2.5一样,可以识别出“清华简”战国古文字,“不仅对的一模一样,连错的都一模一样”。 7 p. M u* f! p 7 k& j9 R2 {1 m: G Q* U5 O 据面壁智能首席科学家、清华大学长聘副教授刘知远介绍,“清华简”的识别能力,是MiniCPM-Llama3-V 2.5研发时内置了一个彩蛋。这是该团队花费数月从清华简逐字扫描,人工标注而来的数据集,并未公开,由此“已经比较确信Llama3-V是对MiniCPM-Llama3-V2.5套壳。”