新足迹

 找回密码
 注册

精华好帖回顾

· 追悼一只曾叫BABY的三脚猫 (2009-6-15) suel · 生活中的感动 (2005-9-23) haha
· 我谈澳洲从军(新加面试情况) (2009-1-9) pal2002 · 小屁孩儿也有自己的小习惯 (2010-6-22) NINGZHUZHU
Advertisement
Advertisement
查看: 1983|回复: 5

[北美] 谷歌推出低成本AI模型 [复制链接]

发表于 2025-2-7 06:58 来自手机 |显示全部楼层
此文章由 potter.leon 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 potter.leon 所有!转贴必须注明作者、出处和本声明,并保持内容完整
李飞飞团队用不到50美元,训练出媲美DeepSeek R1的AI推理模型
2025-02-06 17:42·新浪财经
https://www.toutiao.com/article/7468239056304996902/

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
Advertisement
Advertisement

发表于 2025-2-7 08:29 |显示全部楼层
此文章由 potter.leon 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 potter.leon 所有!转贴必须注明作者、出处和本声明,并保持内容完整
李飞飞团队“50美元”复现DeepSeek R1真相:基座为阿里云Qwen模型

2025-02-06 20:14·财联社

《科创板日报》2月6日讯 (记者 毛明江 黄心怡)今日一则关于人工智能领域的新闻引发广泛关注。

据报道,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

这一消息无疑在AI界投下了一颗重磅炸弹,真相究竟如何?

《科创板日报》记者调查和采访业内人士后发现,s1模型的训练并非从零开始,而是基于阿里云通义千问(Qwen)模型进行监督微调。这意味着,s1模型的神奇“低成本”,是建立在已具备强大能力的开源基础模型之上。

▍通义模型的“基座”作用

根据李飞飞等人的研究论文,s1模型的训练仅使用了1000个样本数据。按照业内共识,这一数据量在AI训练中可谓微乎其微,通常不足以训练出一个具备推理能力的模型。

青年AI科学家、上海交通大学人工智能学院谢伟迪副教授告诉《科创板日报》记者,如果仔细研究斯坦福s1的论文会发现,s1模型的神奇是以通义千问模型为基座进行微调,这1000个样本训练的作用更像是“锦上添花”,而非“从零开始”。

国内某知名大模型公司CEO也向《科创板日报》记者表示:“从论文原文来看,所谓用50美元训练出新的具有推理能力的模型,实际上只是用从谷歌模型中提炼出来的1000个样本,然后对通义千问模型进行监督微调。这种微调的成本确实很低,但明显是站在既有领先模型的‘肩上’才能做到。”


斯坦福s1论文原文也注明模型是以阿里通义千问模型为基础微调
谢伟迪指出,国内外还有其他团队也声称用极低的成本,训练出了具有推理能力的新模型。但一阅读其论文原文,就会发现它们无一例外都是基于通义模型作为基座进行的。


国外多位人工智能研究者也指出,不少的“新”模型都是建立通义模型基础上
“以通义千问模型作为基座,确实可以用很少的样本数据就达到产生新的推理模型的效果,但如果换成其他基座模型,新模型能力却没有任何的提升。所以,能力真正神奇的是Qwen模型,而不是s1。 ” 谢伟迪说。

▍低成本训练大模型有局限,但也是方向

尽管s1模型的低成本训练在某种程度上展示了AI训练的潜力,但其局限性也不容忽视。

首先,这种低成本训练依赖于已有的强大基座模型,如阿里通义千问模型。如果没有这样的基座模型,低成本训练的效果将大打折扣。

其次,1000个样本数据的训练量在大多数情况下是不够的,尤其是在需要处理复杂任务的场景中。

此外,低成本训练的成功也引发了对AI模型知识产权和伦理问题的讨论。如果越来越多的研究依赖于已有的基座模型进行微调,那么这些基座模型的开发者是否应该获得相应的回报?如何确保AI技术的公平使用和共享?这些问题都需要业界进一步探讨和解决。

尽管s1模型的低成本训练引发了争议,但其背后的研究思路无疑为AI领域提供了新的思考方向。

武汉人工智能学院一位资深研究人员向《科创板日报》记者表示,如何在保证模型性能的前提下,降低训练成本,是AI研究的一个重要课题。未来,随着技术的进步和算法的优化,或许我们真的能够看到更多低成本、高性能的AI模型问世。

(科创板日报记者 黄心怡)

https://www.toutiao.com/article/7468278311374914083/
以有涯随无涯,殆已

发表于 2025-2-7 09:02 |显示全部楼层
此文章由 potter.leon 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 potter.leon 所有!转贴必须注明作者、出处和本声明,并保持内容完整
john-2204 发表于 2025-2-7 09:59
确实没什么用……

我问了许多很著名的人物,都是拼命地转呀转..

举个例子?
以有涯随无涯,殆已

发表于 2025-2-7 09:27 |显示全部楼层
此文章由 potter.leon 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 potter.leon 所有!转贴必须注明作者、出处和本声明,并保持内容完整
john-2204 发表于 2025-2-7 10:25
周承菼 朱通伯 ..

这两人百度百科里都有,DS不会屏蔽吧?
以有涯随无涯,殆已

发表于 2025-2-7 09:39 |显示全部楼层
此文章由 potter.leon 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 potter.leon 所有!转贴必须注明作者、出处和本声明,并保持内容完整
john-2204 发表于 2025-2-7 10:36
估计不是屏蔽,而是没有给它提供信息,也就是说这机器人还没学会到其他公开的平台寻找有关信息的本事.. ...

那应该怪它“蒸馏”的那个模型,巧妇难为无米之炊啊,这数据本来也没墙,它没有cover到
以有涯随无涯,殆已

发表于 2025-2-7 10:58 |显示全部楼层
此文章由 potter.leon 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 potter.leon 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2025-2-7 11:26
阿姨不是读电脑,芯片,电池,工程,飞机制造,军舰,潜艇和航天制造出身的。

阿姨是文科生,你记住这一 ...

我看有些足友自己标的就是博士,估计这里搞研究的人也不少吧,说出来的话听着就那么霸气十足
以有涯随无涯,殆已
Advertisement
Advertisement

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部