新足迹

 找回密码
 注册

精华好帖回顾

· 【参加活动~圣诞新年秀】summer retro - 126# 更新2套素素的搭配,新鲜到手mbmj和hogan平底鞋 (2013-12-19) peanut · 煮夫手记十四 烙馍卷菜 (2011-3-13) amon54
· 家常中式炒意面,顺带附送dinner roll小点心!! (2005-6-24) liz · 来来来,我们再来焦虑下 ---- 关于小朋友学中文 ---- 足迹网友很给力,焦虑得非常到位! (2011-1-3) 第一名
Advertisement
Advertisement
查看: 1300|回复: 60

[北美] 谷歌推出低成本AI模型 [复制链接]

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-2-7 07:00 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
路透社:谷歌推出低成本AI模型,应对成本压力加剧  

路透社旧金山2月5日消息,谷歌母公司Alphabet周三宣布更新其Gemini大型语言模型家族,并推出一款定价具有竞争力的新产品线,以挑战中国竞争对手DeepSeek等低成本人工智能模型。  

这家科技巨头提供多个版本的Gemini模型,价格和性能各不相同。

此前,谷歌已经推出了一款名为“Flash”的轻量级版本,而此次发布的新模型“Flash-Lite”成本更低。  

新产品发布  

周三,谷歌正式向公众推出Gemini 2.0 Flash,此前该版本曾在去年12月向开发者进行预览。

此外,谷歌还推出了Flash-Lite,并发布了旗舰“Pro”模型的新测试版本。  

谷歌DeepMind AI实验室首席技术官卡武库奥卢(Koray Kavukcuoglu)在新闻稿中表示,谷歌是在收到关于Flash 1.5版本的积极反馈后,决定开发Flash-Lite的。

而Gemini 2.0 Flash的成本高于其前代版本。  

AI成本问题引发关注  

近期,人工智能模型的开发成本及使用成本受到投资者密切关注。

DeepSeek近日披露,其最新模型的最终训练成本不到600万美元,而美国主要AI公司的开发人员表示,实际总成本可能远高于这一数额。  

尽管如此,DeepSeek的崛起仍在Alphabet,微软和Meta等竞争对手的财报电话会议上引发讨论。

目前,这些公司均表示将继续大规模投入资本支出,以保持在AI领域的领先地位。  

受投资者对资本支出计划的悲观情绪影响,Alphabet股价周二下跌。

该公司计划的资本支出增长比华尔街预期高出29%。  

定价策略对比  

Gemini Flash-Lite的部分数据输入费用为每百万个token(AI模型处理的数据单位)0.019美元,而OpenAI旗舰模型的低成本版本为0.075美元,DeepSeek的低成本模型为0.014美元。






来源:

https://www.reuters.com/technolo ... tensify-2025-02-05/

By Kenrick Cai
February 6, 20253:02 AM GMT+11Updated 2 hours ago
仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。
Advertisement
Advertisement

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-2-7 07:00 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
文章要点:  

1. 谷歌推出低成本AI模型Flash-Lite,与DeepSeek等竞争对手展开价格竞争。  

2. AI开发和使用成本成为投资者关注焦点,DeepSeek的低成本训练引发讨论。  

3. Alphabet计划大幅增加资本支出,超出市场预期,导致股价下跌。
仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。

发表于 2025-2-7 07:07 来自手机 |显示全部楼层
此文章由 amyo(∩_∩)o 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 amyo(∩_∩)o 所有!转贴必须注明作者、出处和本声明,并保持内容完整
被逼降价

发表于 2025-2-7 07:12 来自手机 |显示全部楼层
此文章由 ericcheung17 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ericcheung17 所有!转贴必须注明作者、出处和本声明,并保持内容完整
说明deepseek的算法是可行的,造福全体使用者。

评分

参与人数 1积分 +8 收起 理由
oed + 8 鲇鱼效应

查看全部评分

发表于 2025-2-7 07:15 来自手机 |显示全部楼层
此文章由 一司机 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 一司机 所有!转贴必须注明作者、出处和本声明,并保持内容完整
低成本AI想出就出,怎么看动辄百亿都是诈骗

发表于 2025-2-7 07:19 |显示全部楼层
此文章由 nvy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 nvy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
诈骗要有一个前提条件,就是围标,大家一起围个高价。万恶的DS打破了这个规矩。
Advertisement
Advertisement

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-2-7 07:23 来自手机 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
nvy 发表于 2025-2-7 07:19
诈骗要有一个前提条件,就是围标,大家一起围个高价。万恶的DS打破了这个规矩。 ...

看来某人重仓了软银/openai,怪不得对DS破口大骂。

关系到自身利益啊,荷包……
仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。

发表于 2025-2-7 07:31 |显示全部楼层
此文章由 xddt 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xddt 所有!转贴必须注明作者、出处和本声明,并保持内容完整
老黄又要骂街了

发表于 2025-2-7 07:39 来自手机 |显示全部楼层
此文章由 lisam 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 lisam 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Ai如果便宜了,反而会促使nv卖更多。

这事情历史上已经发生过无数次了。

蒸汽机效率提升10倍,煤炭销量增加1万倍。

CPU摩尔定律几年算力翻番,但芯片销量不减反增一万倍。1960年代科学家曾经预言全世界只需要这种计算机5台就够了(登月用的那个),可以满足全世界的算力。你跟他说再过60年,我的iPhone就比你这大楼算力高,全世界几乎人手一个,他肯定不信。

发表于 2025-2-7 07:46 来自手机 |显示全部楼层
此文章由 rayki 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 rayki 所有!转贴必须注明作者、出处和本声明,并保持内容完整
李飞飞团队50美元实现类deepseek的模型,以后AI大众化了

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-2-7 07:50 来自手机 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
rayki 发表于 2025-2-7 07:46
李飞飞团队50美元实现类deepseek的模型,以后AI大众化了

好事情,等她的放出llm来让大家比较一下。

有竞争才有进步。

仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。
Advertisement
Advertisement

发表于 2025-2-7 07:54 来自手机 |显示全部楼层
此文章由 rayki 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 rayki 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 rayki 于 2025-2-7 08:00 编辑
dootbear 发表于 2025-2-7 07:50
好事情,等她的放出llm来让大家比较一下。

有竞争才有进步。


具体细节不知道,貌似真实的,也就说以前OpenAI 花巨资闭源走不通了.
看好deepseek和新模型的比较测试.

据说采用了同样的蒸馏技术,那是不是以后API 我们个人都可以train了,那这代大模型基本上还在起步阶段.
我来问道无余话,云在青天水在瓶

发表于 2025-2-7 07:58 来自手机 |显示全部楼层
此文章由 potter.leon 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 potter.leon 所有!转贴必须注明作者、出处和本声明,并保持内容完整
李飞飞团队用不到50美元,训练出媲美DeepSeek R1的AI推理模型
2025-02-06 17:42·新浪财经
https://www.toutiao.com/article/7468239056304996902/

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

发表于 2025-2-7 08:01 |显示全部楼层
此文章由 violots 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 violots 所有!转贴必须注明作者、出处和本声明,并保持内容完整
AI 也白菜价了

发表于 2025-2-7 08:28 |显示全部楼层
此文章由 nvy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 nvy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
lisam 发表于 2025-2-7 07:39
Ai如果便宜了,反而会促使nv卖更多。

这事情历史上已经发生过无数次了。

跟效率关系不大,只有跟内燃机比才看效率,关键是价钱,偏偏英伟达就是卖高价。

发表于 2025-2-7 08:31 |显示全部楼层
此文章由 nvy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 nvy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
potter.leon 发表于 2025-2-7 07:58
李飞飞团队用不到50美元,训练出媲美DeepSeek R1的AI推理模型
2025-02-06 17:42·新浪财经
https://www.tou ...

这个肯定是胡编的 。不过,对美国的AI界可不是一个好笑话。
Advertisement
Advertisement

发表于 2025-2-7 08:33 来自手机 |显示全部楼层
此文章由 dealbot 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dealbot 所有!转贴必须注明作者、出处和本声明,并保持内容完整
potter.leon 发表于 2025-2-7 07:58
李飞飞团队用不到50美元,训练出媲美DeepSeek R1的AI推理模型
2025-02-06 17:42·新浪财经
https://www.tou ...

那是电费吧

评分

参与人数 1积分 +5 收起 理由
limuc1 + 5 你太有才了

查看全部评分

发表于 2025-2-7 08:35 |显示全部楼层
此文章由 limuc1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 limuc1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
以后活都让AI 干了,没人啥事了,一生叹息,ai,

发表于 2025-2-7 08:37 |显示全部楼层
此文章由 nvy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 nvy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
DS说是美国现在成本的1%的也要600万美元,挂个名人李飞飞的名字就整成了50美元,其实根本就没花一分钱,是李飞飞叫了一份披萨

发表于 2025-2-7 09:16 来自手机 |显示全部楼层
此文章由 大杨树 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 大杨树 所有!转贴必须注明作者、出处和本声明,并保持内容完整
现在的AI有什么用处?

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-2-7 09:19 来自手机 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
大杨树 发表于 2025-2-7 09:16
现在的AI有什么用处?

看病
Advertisement
Advertisement

发表于 2025-2-7 09:25 |显示全部楼层
此文章由 blahblah 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 blahblah 所有!转贴必须注明作者、出处和本声明,并保持内容完整
AI小白,不太明白这个所谓的“蒸馏“,就是在别人已经装了鱼的小桶里钓鱼?

如果是这样,那要是别人把小桶加了盖子,不让钓了,或者收费了怎么办?又或者准备更多的桶,直接让人来买鱼,那个在桶里钓鱼的怎么办?

发表于 2025-2-7 09:26 |显示全部楼层
此文章由 rayki 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 rayki 所有!转贴必须注明作者、出处和本声明,并保持内容完整
blahblah 发表于 2025-2-7 09:25
AI小白,不太明白这个所谓的“蒸馏“,就是在别人已经装了鱼的小桶里钓鱼?

如果是这样,那要是别人把小桶 ...

应该是付费API,所以不能关闭盖子的,因为已经付过费用了,哈哈。
我来问道无余话,云在青天水在瓶

发表于 2025-2-7 09:29 |显示全部楼层
此文章由 potter.leon 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 potter.leon 所有!转贴必须注明作者、出处和本声明,并保持内容完整
李飞飞团队“50美元”复现DeepSeek R1真相:基座为阿里云Qwen模型

2025-02-06 20:14·财联社

《科创板日报》2月6日讯 (记者 毛明江 黄心怡)今日一则关于人工智能领域的新闻引发广泛关注。

据报道,李飞飞等斯坦福大学和华盛顿大学的研究人员以不到50美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。

这一消息无疑在AI界投下了一颗重磅炸弹,真相究竟如何?

《科创板日报》记者调查和采访业内人士后发现,s1模型的训练并非从零开始,而是基于阿里云通义千问(Qwen)模型进行监督微调。这意味着,s1模型的神奇“低成本”,是建立在已具备强大能力的开源基础模型之上。

▍通义模型的“基座”作用

根据李飞飞等人的研究论文,s1模型的训练仅使用了1000个样本数据。按照业内共识,这一数据量在AI训练中可谓微乎其微,通常不足以训练出一个具备推理能力的模型。

青年AI科学家、上海交通大学人工智能学院谢伟迪副教授告诉《科创板日报》记者,如果仔细研究斯坦福s1的论文会发现,s1模型的神奇是以通义千问模型为基座进行微调,这1000个样本训练的作用更像是“锦上添花”,而非“从零开始”。

国内某知名大模型公司CEO也向《科创板日报》记者表示:“从论文原文来看,所谓用50美元训练出新的具有推理能力的模型,实际上只是用从谷歌模型中提炼出来的1000个样本,然后对通义千问模型进行监督微调。这种微调的成本确实很低,但明显是站在既有领先模型的‘肩上’才能做到。”


斯坦福s1论文原文也注明模型是以阿里通义千问模型为基础微调
谢伟迪指出,国内外还有其他团队也声称用极低的成本,训练出了具有推理能力的新模型。但一阅读其论文原文,就会发现它们无一例外都是基于通义模型作为基座进行的。


国外多位人工智能研究者也指出,不少的“新”模型都是建立通义模型基础上
“以通义千问模型作为基座,确实可以用很少的样本数据就达到产生新的推理模型的效果,但如果换成其他基座模型,新模型能力却没有任何的提升。所以,能力真正神奇的是Qwen模型,而不是s1。 ” 谢伟迪说。

▍低成本训练大模型有局限,但也是方向

尽管s1模型的低成本训练在某种程度上展示了AI训练的潜力,但其局限性也不容忽视。

首先,这种低成本训练依赖于已有的强大基座模型,如阿里通义千问模型。如果没有这样的基座模型,低成本训练的效果将大打折扣。

其次,1000个样本数据的训练量在大多数情况下是不够的,尤其是在需要处理复杂任务的场景中。

此外,低成本训练的成功也引发了对AI模型知识产权和伦理问题的讨论。如果越来越多的研究依赖于已有的基座模型进行微调,那么这些基座模型的开发者是否应该获得相应的回报?如何确保AI技术的公平使用和共享?这些问题都需要业界进一步探讨和解决。

尽管s1模型的低成本训练引发了争议,但其背后的研究思路无疑为AI领域提供了新的思考方向。

武汉人工智能学院一位资深研究人员向《科创板日报》记者表示,如何在保证模型性能的前提下,降低训练成本,是AI研究的一个重要课题。未来,随着技术的进步和算法的优化,或许我们真的能够看到更多低成本、高性能的AI模型问世。

(科创板日报记者 黄心怡)

https://www.toutiao.com/article/7468278311374914083/
以有涯随无涯,殆已

发表于 2025-2-7 09:31 |显示全部楼层
此文章由 blahblah 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 blahblah 所有!转贴必须注明作者、出处和本声明,并保持内容完整
rayki 发表于 2025-2-7 09:26
应该是付费API,所以不能关闭盖子的,因为已经付过费用了,哈哈。

那如果加价呢?加到和一般买鱼的人一样?或者对于买鱼的降价?

这不都是直接在池里钓鱼,提供装满鱼的桶子的人说了算?

发表于 2025-2-7 09:37 |显示全部楼层
此文章由 rayki 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 rayki 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 rayki 于 2025-2-7 09:40 编辑
blahblah 发表于 2025-2-7 09:31
那如果加价呢?加到和一般买鱼的人一样?或者对于买鱼的降价?

这不都是直接在池里钓鱼,提供装满鱼的桶 ...


确实可以提高价格,也就是提高蒸馏的成本。
但是这件事和蒸馏的技术关系不大,  是通过低档显卡,采用所有人都在用的蒸馏技术(API),bypass CUDA(好像这么写),这个东西是显卡自有的算法吧,然后据说deepseek为了加速这块,直接用了汇编。然后就得到了今天的deepseek。
李飞飞这个更nb了,直接降到50美元,以前那些动则5m,50m+的train的费用都是胡扯么,明显在忽悠投资人和老百姓。

咱也不是专业人士,不太懂,但是貌似我前面说的几个步骤里面,低端显卡,bypass CUDA更加重要一点,至于蒸馏,所有OpenAI的下游厂家都在付费使用,甚至我们付费用户也可以。

评分

参与人数 1积分 +2 收起 理由
blahblah + 2 感谢分享

查看全部评分

我来问道无余话,云在青天水在瓶
Advertisement
Advertisement

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-2-7 09:43 来自手机 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
如果可以by pass cuda,老黄要哭了。

发表于 2025-2-7 09:47 |显示全部楼层
此文章由 rayki 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 rayki 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2025-2-7 09:43
如果可以by pass cuda,老黄要哭了。


是啊,deepseek 真牛,所以好像老黄赶紧出来拥抱deepseek,网站都写了支持啥的,估计是打不过赶紧站队了。
哈哈。 具体不知道,但是好像是通过汇编,直接bypass CUDA了。
我来问道无余话,云在青天水在瓶

发表于 2025-2-7 09:59 |显示全部楼层
此文章由 john-2204 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 john-2204 所有!转贴必须注明作者、出处和本声明,并保持内容完整
大杨树 发表于 2025-2-7 09:16
现在的AI有什么用处?

确实没什么用……

我问了许多很著名的人物,都是拼命地转呀转..

最后说,对不起..

信息量太少了,离智慧机器人差远啦..

发表于 2025-2-7 10:02 |显示全部楼层
此文章由 potter.leon 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 potter.leon 所有!转贴必须注明作者、出处和本声明,并保持内容完整
john-2204 发表于 2025-2-7 09:59
确实没什么用……

我问了许多很著名的人物,都是拼命地转呀转..

举个例子?
以有涯随无涯,殆已

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部