查看原文
其他

抄袭中国大模型,斯坦福团队致歉

曹卫国 参考消息 2024-06-27

据香港《南华早报》网站6月4日报道,在被指控抄袭中国科学家的开源研究成果来创建新的人工智能模型后,斯坦福大学的一个团队作出了道歉。
在5月29日发布时,这个名为Llama3-V的人工智能模型曾因其强大性能而引发全球关注。但最近,两名参与该项目的斯坦福大学学生承认其架构与另一个名为MiniCPM-Llama3-V 2.5的模型“非常类似”。
在发布于社交平台X上的声明中,斯坦福大学的本科生阿克什·加格和西达尔特·夏尔马说:“我们希望真诚地向原始作者致歉。”他们还称该模型会被撤下。
报道说,Llama3-V由加格、夏尔马和另一名非斯坦福大学研究者穆斯塔法·贾德里发布。他们声称该模型在以约500美元的成本进行训练后,性能可与GPT-4V等尖端人工智能模型相媲美。
在发布后不久,该模型就冲上了热门人工智能平台趋势榜的前五名。
但人工智能领域的人士随即提出质疑,认为该模型的很大一部分涉嫌抄袭MiniCPM-Llama3-V 2.5模型。后者是由清华大学的团队和初创企业面壁智能联合开发的。
一名举报者在开源平台GitHub上发布的内容表明,这两个项目的模型结构和代码几乎完全一样。
面壁智能的一位联合创始人4日在社交平台上发文称,已经“比较确信”新模型是对MiniCPM-Llama3-V 2.5的“套壳”。他说:“连做错的样例都一样。”
在社交平台X上的声明中,加格和夏尔马表示:“我们向作者道歉,并对没有尽责核实这项研究的原创性承担全部责任。”
斯坦福大学人工智能实验室主任克里斯托弗·曼宁4日在社交平台X上发文称:“‘造假直至成功’是一种不光彩的硅谷产物。”
这一事件已在社交平台上掀起波澜,并带来更为广泛的关于中国人工智能进步的讨论。
谷歌“深层思维”人工智能实验室的研究人员卢卡斯·拜尔在X平台发文评论说,“如此出色的模型”早已存在——指MiniCPM-Llama3-V 2.5,但受到的关注却少得多,只因为它不是来自某个常春藤盟校,而是来自一个中国实验室。

(更多国际新闻,参见《参考消息》数字报,点击此处可订阅或续订)


微信审核 | 邓媛
内容编审 | 王迪 粘轶锋 王缅
微信编辑 | 郭庆娜 董磊

热文推荐






点击下方图片,立即订阅《参考消息》
继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存