新足迹

 找回密码
 注册

精华好帖回顾

· 泰,不太一样 (真人骚已附) (2013-6-6) uandme · 澳洲的好人 (2005-7-27) kele
· ******铁板上跳舞的韩式铁板鱿鱼以及附属产品韩式铁板鸡***** (2013-4-24) chesecake · 笋丝炒肉丝 (2005-10-28) astina
Advertisement
Advertisement
查看: 1943|回复: 56

DeepSeek冒起暴露了英伟达的弱点 [复制链接]

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-30 09:04 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
华尔街日报:DeepSeek冒起暴露了英伟达的弱点  


DeepSeek的迅速崛起,暴露了英伟达面临的最大风险:市场对其高端AI芯片的旺盛需求可能会减弱。  

作为人工智能热潮中的“计算武器供应商”,英伟达的成功吸引了众多竞争对手试图削弱其主导地位。

其中包括其他芯片制造商,以及正在开发自研AI芯片以降低成本的客户。

然而,即便DeepSeek对英伟达业务的最终影响尚不明朗,几乎没有人曾预料到,一家灵活的中国AI初创公司会成为威胁。  

英伟达股价剧烈波动,DeepSeek引发市场担忧  

英伟达可能是AI热潮中最大的受益者,仅在过去四个季度,其利润就超过630亿美元。自2022年底以来,英伟达股价已飙升八倍。  

但随着DeepSeek的热度在上周末迅速升温,英伟达股价周一大跌约17%。不过,周二股价企稳,收涨8.9%,报128.99美元,今天有下跌5%。  

英伟达在周一的一份声明中试图将DeepSeek的崛起解读为积极信号,称DeepSeek的突破“很好地展示了AI模型的新运行方式”。

英伟达表示,AI模型的推理(inference)需要大量英伟达芯片支持,这也是AI技术落地的重要环节。  

DeepSeek或改变AI产业格局,削弱英伟达高端芯片需求  

投资者的担忧在于,DeepSeek更高效的AI开发方式可能会打破现有格局,目前,最先进的AI模型通常需要大量英伟达高端AI芯片进行训练。AI的快速发展促使科技巨头大量投资AI数据中心,导致对英伟达最强大芯片的需求几乎无止境,并一度出现供不应求的情况。  

同时,亚马逊,谷歌和微软等英伟达的重要客户,近年来也在开发自研芯片,以支持各自的AI平台。

英特尔和超威半导体(AMD)等竞争对手也在推动自己的AI芯片,以挑战英伟达的市场地位。  

现在,中国初创公司DeepSeek推出了一款低成本AI模型,其能力据称可媲美全球最先进模型之一,但训练所用的英伟达芯片却大幅减少。DeepSeek的技术突破在华尔街和华盛顿引发震动,因为它被视为对美国AI技术领先地位的潜在威胁。  

DeepSeek的崛起或引发更严格的对华芯片出口管制  

DeepSeek的进展可能会促使美国政府重新审查英伟达对华AI芯片的销售政策。近年来,美国政府不断收紧对华芯片出口限制,以遏制中国开发最先进AI工具的能力。英伟达此前已经调整策略,为中国市场生产性能受限但符合美国管制要求的芯片,而DeepSeek表示,其最新的“R1”模型便是使用了这些芯片训练而成。  

摩根士丹利分析师在周二的报告中估计,过去12个月内,英伟达向中国市场销售了超过一百亿美元的特供芯片。分析师指出,进一步收紧出口管制可能是DeepSeek崛起带来的潜在影响之一。不过,报告也指出,之前的出口限制并未阻止中国开发AI模型,而更严格的限制反而可能加速中国本土芯片技术的发展。  

DeepSeek的AI模式可能对英伟达利大于弊?  

部分芯片行业高管认为,DeepSeek的技术进步最终可能对英伟达有利,而非威胁。

AI芯片初创公司Groq的首席执行官罗斯(Jonathan Ross)表示,AI推理成本的降低将提高AI应用的普及度,从而推动更高性能AI模型的训练需求。  

罗斯说道,“如果推理成本太高,人们就不会大量使用AI。但如果使用率提高,开发者就会更愿意投资训练更好的模型。训练和推理之间存在一个良性循环。”  

科技行业人士也提到了“杰文斯悖论”(Jevons paradox),即某项资源使用效率提高后,反而可能导致整体消费增加。  

伦敦Earlybird Venture Capital的合伙人阿卡什·巴杰瓦(Akash Bajwa)表示,“目前,在多个领域对AI的需求都很高,但由于推理成本过高,许多任务的AI化尚未实现。DeepSeek提供更低的价格,可能会释放这些潜在需求。”  

DeepSeek仍需英伟达芯片,美国行业对其持怀疑态度  

尽管DeepSeek采用了更高效的AI开发方式,但分析师认为,该公司仍然需要大量计算能力,而英伟达芯片在这一环节仍至关重要。DeepSeek的R1模型在生成多步推理答案时,使用了一些工程优化手段,这些手段需要强大的计算支持。  

此外,部分美国AI行业人士对DeepSeek的宣称持怀疑态度。他们认为,中国研究人员可能在美国加强管制前囤积了英伟达的先进芯片,或者通过海外渠道获取英伟达芯片计算能力。拜登政府在任期最后阶段出台了新规定,以堵住这一漏洞。  

AI投资热潮不减,科技巨头持续加码  

与此同时,AI行业的关注点已逐步从训练大型模型转向部署和应用。英伟达去年表示,其数据中心业务中已有超过40%的收入来自推理环节,而DeepSeek目前面临的挑战之一便是如何高效为全球用户提供其AI模型的服务。  

就在DeepSeek成为AI行业焦点的几天前,Meta首席执行官扎克伯格(Mark Zuckerberg)宣布,公司今年将投入多达650亿美元用于AI及数据中心建设,增幅高达70%。Meta预计将在周三公布季度财报。  

此外,微软本月早些时候表示,在截至6月的2024财年,公司计划投资800亿美元用于AI数据中心建设。

微软和另一家重金投入AI的企业特斯拉也将在周三发布财报。  

上周,多家科技企业高管承诺将在美国投资高达5000亿美元用于AI基础设施建设。

这一计划是在特朗普开始第二任期后,于白宫宣布的。  






来源:

https://www.wsj.com/tech/ai/deep ... 0f?mod=hp_lead_pos3

By
Asa Fitch
Follow
Jan. 28, 2025 9:00 pm ET

仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。
Advertisement
Advertisement

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-30 09:05 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本文要点:  

1. DeepSeek的崛起暴露英伟达的市场风险,可能减少对其高端AI芯片的需求,导致英伟达股价一度大跌17%。  

2. AI行业此前依赖英伟达高端芯片进行训练,而DeepSeek的更高效方法可能改变这一格局,影响英伟达的市场地位。  

3. 美国政府可能因DeepSeek的进展进一步收紧对华AI芯片出口,摩根士丹利估计,英伟达过去一年在中国市场销售了超100亿美元的特供芯片。  

4. 一些行业高管认为,DeepSeek的模式可能反而有利于英伟达,因为更低的AI使用成本会刺激更多高端模型的训练需求。  

5. 分析师指出,DeepSeek的R1模型仍需要大量计算能力,英伟达芯片仍在其AI推理过程中扮演重要角色。
  
6. 美国AI行业对DeepSeek的技术来源存疑,认为中国可能在出口管制前囤积英伟达芯片或通过海外渠道获得计算能力。  

7. AI投资热潮不减,Meta宣布今年投资650亿美元,微软计划投入八百亿美元,用于AI数据中心建设。  

8. 上周,科技巨头承诺向美国AI基础设施投资五千亿美元,这一计划是在特朗普开始第二任期后宣布的。

仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。

发表于 2025-1-30 09:15 来自手机 |显示全部楼层
此文章由 凯瑟琳琳 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 凯瑟琳琳 所有!转贴必须注明作者、出处和本声明,并保持内容完整
如果DeepSeek的低训练成本是真的,那首先该被颠覆的就不是英伟达,而是OpenAI。因为这等于有人用500块造出了一辆特斯拉,那受冲击最大的,不是卖轮胎的米其林,而是特斯拉自己。英伟达卖的是芯片,不管训练AI花500万还是500亿,只要大模型还在跑,算力的需求就不会消失。

假设DeepSeek真的大幅降低了训练成本,那意味着什么?意味着AI的准入门槛降低,意味着更多公司能训练自己的模型,意味着AI不再是少数科技巨头的专利,而是成为更广泛的基础设施。然后呢?需求爆炸,市场扩大,需要训练的AI模型数量增加,最终,算力的需求反而会更旺盛。

这就像19世纪末,内燃机效率提高了,结果大家不是少用汽油,而是汽车进入千家万户,跑满了大街小巷,整个市场反而变得更大。如果DeepSeek的突破是真的,那英伟达的角色更像是石油公司——内燃机越普及,石油卖得越多;AI越普及,芯片卖得越好。

DeepSeek真正证明的,可能不是‘英伟达不需要了’,而是‘AI的市场比想象中更庞大’。

评分

参与人数 3积分 +9 收起 理由
cc2121 + 1 感谢分享
pzh + 3 你太有才了
hikeman + 5 感谢分享

查看全部评分

发表于 2025-1-30 09:22 来自手机 |显示全部楼层
此文章由 potter.leon 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 potter.leon 所有!转贴必须注明作者、出处和本声明,并保持内容完整
openai如果真开源了,可能超越就更简单了吧?机器人机器狗无人机自动驾驶好像都是人家一开源那边马上弯道超车吧?即便不开源,套个壳也比从头做简单许多。做了就承认呗,骗人就不应该了,你这骗人那骗人,让别人怎么信你?这就是品性的问题了。

发表于 2025-1-30 09:24 来自手机 |显示全部楼层
此文章由 potter.leon 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 potter.leon 所有!转贴必须注明作者、出处和本声明,并保持内容完整
软件可以套壳,硬件只能打磨,挺明显的逻辑,挺简单的“对账”。

发表于 2025-1-30 09:30 |显示全部楼层
此文章由 lulucai 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 lulucai 所有!转贴必须注明作者、出处和本声明,并保持内容完整
凯瑟琳琳 发表于 2025-1-30 09:15
如果DeepSeek的低训练成本是真的,那首先该被颠覆的就不是英伟达,而是OpenAI。因为这等于有人用500块造出 ...

Open AI 的人前2天跑出来说他们早就发现这些了,这是他们做O1时候发现的一些原理。如果是真的,那就说明还是需要算力的。毕竟他们早就知道这些算法了,然而还是需要更多芯片
Advertisement
Advertisement

发表于 2025-1-30 09:40 |显示全部楼层
此文章由 absd 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 absd 所有!转贴必须注明作者、出处和本声明,并保持内容完整
凯瑟琳琳 发表于 2025-1-30 09:15
如果DeepSeek的低训练成本是真的,那首先该被颠覆的就不是英伟达,而是OpenAI。因为这等于有人用500块造出 ...

英伟达怎么不受影响?

说明高性能的算力芯片不是必须的,Intel也好,amd也好,苹果也好,他们的芯片都可以用了。。。

竞争激烈了, 价格就下来了。。。

英伟达再也不能因为其垄断地位卖高价了。。。

评分

参与人数 1积分 +3 收起 理由
robin_ld + 3 我很赞同

查看全部评分

发表于 2025-1-30 09:57 |显示全部楼层
此文章由 dunkerlc 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dunkerlc 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 dunkerlc 于 2025-1-30 10:23 编辑
凯瑟琳琳 发表于 2025-1-30 09:15
如果DeepSeek的低训练成本是真的,那首先该被颠覆的就不是英伟达,而是OpenAI。因为这等于有人用500块造出 ...


首先,和传统行业不一样,科技圈是最需要新概念去刺激的。例如蔚来十年来每年亏100个亿,最近两年每年亏200个亿依然受投资追捧。

2016年,英伟达10系显卡发布,对比前一代9系,有100%性能提升。同时比特币价值开始疯狂上涨,整个市场开始买英伟达显卡,“挖矿”这个词第一次走进大众视野。显卡价格开始飞涨,英伟达迫于压力发布锁算力的Low Hash Rate显卡型号(但是显然只是做做样子)。英伟达股价从1美元开始腾飞。公司业务也从游戏显卡业务开始向DC业务倾斜。

2021年末,脸书在连续股价下滑的情况下All in元宇宙概念,甚至改名Meta,股价之后一路上涨。随之而来的NFT,区块链,人工智能等技术开始妇孺皆知。

2022年末, OpenAI,一个非营利组织,发布Chatgpt,给整个世界一个概念,想玩AI,就必须堆算力,买英伟达显卡,用CUDA统一计算架构。之后这个世界无数个LLM如雨后春笋,但是核心离不开Chatgpt的这个概念。英伟达的DC业务随之达到高点,占比整个公司业务超过8成。英伟达实际成为整个AI市场的焦点。

2024年末,Deepseek发布,打破了OpenAI的概念,玩AI,不一定要堆算力,不一定要CUDA,这个题目还有其他解法。这个世界是多样的。此时市场焦点必然会从英伟达转移,之后大家不是订着算力,而是算法,是非CUDA计算架构。

Deepseek的发布,和OpenAI不是对立的,而是提供的另外一种可能,一个被外界认为不可能的可能。

都开源了,还怀疑用个人获取Chatgpt的API获取数据。还模型蒸馏。。。

数据模型蒸馏技术,一个2014年就发布的概念,在OpenAI发布后被无数数据模型用烂仍然被OpenAI打得鼻青脸肿的技术,被拿出来说。

这些人正好应证了智子疑邻的典故。

宋有富人,天雨墙坏。其子曰:“不筑,必将有盗。”其邻人之父亦云。暮而果大亡其财,其家甚智其子,而疑邻人之父。

评分

参与人数 4积分 +20 收起 理由
shayy + 5 你太有才了
yanqishui32 + 8 精品文章
pomer + 5 感谢分享

查看全部评分

发表于 2025-1-30 10:04 来自手机 |显示全部楼层
此文章由 凯瑟琳琳 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 凯瑟琳琳 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dunkerlc 发表于 2025-1-30 09:57
首先,和传统行业不一样,科技圈是最需要新概念去刺激的。

2016年,英伟达10系显卡发布,对比前一代9系 ...

问题是,AI这东西,真的能靠‘概念’跑起来吗?

2016年挖矿带火了英伟达,但如果显卡算力不够强,矿工会买吗?2021年Meta All in元宇宙,股价是涨了,但现实是元宇宙凉得比泡沫破得还快。2022年OpenAI的ChatGPT让世界见识到了LLM的威力,但如果没有英伟达的GPU,这些大模型连跑都跑不动,再好的算法也是摆设。

科技圈的确需要新概念去刺激,但概念不能当饭吃。DeepSeek的核心逻辑是‘AI训练可以不堆算力’,可它自己训练R1用的,还是英伟达的芯片,跑的,还是CUDA。说白了,它靠的还是英伟达这套生态。说市场会因此抛弃英伟达,等于说电动车出来后,大家就不需要锂电池了——现实是,锂电需求反而暴涨。

至于‘数据蒸馏’被OpenAI打得鼻青脸肿这件事——不妨想想,2014年就有的技术,OpenAI一路走过来也没靠这个弯道超车,现在DeepSeek能靠它改变AI市场格局?这就像‘水变油’的故事,每隔几年总会有人拿出来讲一遍,但市场最终只认真正跑出来的东西。

所以,这更像是宋朝那位‘智子疑邻’的故事——你告诉我‘不筑,必将有盗’,但问题是,墙还没塌,邻居家就已经开始换新砖了。

发表于 2025-1-30 10:06 |显示全部楼层
此文章由 dunkerlc 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dunkerlc 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 dunkerlc 于 2025-1-30 10:10 编辑
凯瑟琳琳 发表于 2025-1-30 10:04
问题是,AI这东西,真的能靠‘概念’跑起来吗?

2016年挖矿带火了英伟达,但如果显卡算力不够强,矿工会 ...


所以科技圈,永远不要下结论,一切都只是暂时的。

都是科技圈做Host炒概念,金融圈捧场追潮流的把戏。

科技圈的目的是股价和眼球,金融圈的目的是赚快钱。

IOT火了,凉了

元宇宙火了,凉了

AI,拭目以待吧

但是不管怎样我站Deepseek一边,Respect。

发表于 2025-1-30 10:06 来自手机 |显示全部楼层
此文章由 figtree1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 figtree1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
要支持英伟达现在市盈率高达60倍的股价,预期利润要成长两倍到三倍,可能吗?能保持住目前利润就不错了。
Advertisement
Advertisement

发表于 2025-1-30 10:16 来自手机 |显示全部楼层
此文章由 figtree1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 figtree1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
灵魂提问,

如果我们突然制造出一种每加仑可行驶 10000 英里的汽车,但它仍然是一种汽油车,你会购买更多的埃克森石油吗?

发表于 2025-1-30 10:39 来自手机 |显示全部楼层
此文章由 shouter 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 shouter 所有!转贴必须注明作者、出处和本声明,并保持内容完整
figtree1 发表于 2025-1-30 10:16
灵魂提问,

如果我们突然制造出一种每加仑可行驶 10000 英里的汽车,但它仍然是一种汽油车,你会购买更多 ...

不是抬杠哈, 我也不太看好nvidia的后市
但是就这个提问的假设而言, 还是需要量化分析, 不能只是定性地来看。 如果汽油机的效率极大提高了, 石油的销量不一定下跌, 如果价格下跌导致的需求释放的比例高于效率的提高比例, 销量是有可能上涨的

我觉得市场对算力和板卡的需求, 无疑是将极大增加的。 但是是不是永远像现在这样N卡一家独大,可能会有疑问

发表于 2025-1-30 10:47 来自手机 |显示全部楼层
此文章由 figtree1 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 figtree1 所有!转贴必须注明作者、出处和本声明,并保持内容完整
shouter 发表于 2025-1-30 10:39
不是抬杠哈, 我也不太看好nvidia的后市
但是就这个提问的假设而言, 还是需要量化分析, 不能只是定性地 ...

短期肯定下跌,因为前期囤积了很多。有分析员预测会有很多卡出现在二级市场。
增加的需求肯定不是价格高昂的高端卡,而是适合小规模的低价卡,这样对英伟达的利润非常不利。而且要面对竞争。

发表于 2025-1-30 10:48 |显示全部楼层
此文章由 sky20000 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 sky20000 所有!转贴必须注明作者、出处和本声明,并保持内容完整
新加坡玩完

发表于 2025-1-30 10:51 |显示全部楼层
此文章由 滚石不生苔藓 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 滚石不生苔藓 所有!转贴必须注明作者、出处和本声明,并保持内容完整
如果不是抄袭的话,可能会推动行业的发展,或者真的做到了AI平民化。
Advertisement
Advertisement

发表于 2025-1-30 10:52 |显示全部楼层
此文章由 laoqiu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 laoqiu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
这个标题的道理是有点很少的。

发表于 2025-1-30 10:57 |显示全部楼层
此文章由 kanweng 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 kanweng 所有!转贴必须注明作者、出处和本声明,并保持内容完整
凯瑟琳琳 发表于 2025-1-30 09:15
如果DeepSeek的低训练成本是真的,那首先该被颠覆的就不是英伟达,而是OpenAI。因为这等于有人用500块造出 ...

AI的准入门槛降低, 也不一定

专业技术方面我不是特别懂,但根据新闻报道,好像是说 DeepSeek 使用 PTX 编程,而不是直接使用 CUDA,从而提升了运行速度。感觉有点像以前写程序时,使用 C、C++ 还是 Java 的区别。

早期的 Java 运行较慢,但容易学习,入门门槛低;而 C 或 C++ 的运行速度较快,但学习曲线陡峭,而且容易出现漏洞。

我猜,英伟达当初开发 CUDA 框架的目的,正是为了让用户能更快上手,使用更方便。CUDA 程序最终还是编辑成 PTX ,再通过汇编生成最终的命令给GPU。 (有C++背景码农很容易学CUDA,  PTX 就是另外一回事了)。

如果是真的DeepSeek 使用 PTX 编程, 那入门槛会更加难,毕竟PTX 编程没那么容易, 而且很容易产生漏洞。

不管怎么样英伟达肯定不会是输家。。。。。






发表于 2025-1-30 10:58 |显示全部楼层
此文章由 dunkerlc 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dunkerlc 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 dunkerlc 于 2025-1-30 11:08 编辑
凯瑟琳琳 发表于 2025-1-30 10:04
问题是,AI这东西,真的能靠‘概念’跑起来吗?

2016年挖矿带火了英伟达,但如果显卡算力不够强,矿工会 ...


仔细看了,您这里面错误不少

1, Deepseek绕开了CUDA,直接用PTX中间语言写的代码。

2,OpenAI是第一个举世闻名的大语言模型,所以他无法使用模型蒸馏,因为没其他人可以给他当老师。
模型蒸馏简单的说就是用别的大规模语言模型做老师,去Trainning自己的小规模语言模型。

3,这个不是电车出来后,大家是否需要锂电池的问题,而是原来世界上就OpenAI一种电车,而且巨费电,并宣称电车只能这么搞,电车必须巨费电!而Deepseek设计出了一种巨省电的电车,那么这个市场的关注点就不在是锂电的需求,而是有没有其他方法可以设计出更省电的电车。

我也怀疑DS是否真的能够改变AI世界格局,但是至少他提供了这么一种可能,而这种可能就是星星之火可以燎原。

什么时候lmarena上面不再是谷歌,OpenAI霸榜的时候才能真正体现DS的价值。

一花独放不是春,百花齐放春满园。

评分

参与人数 2积分 +11 收起 理由
yeshu + 3 我很赞同
happyheros + 8 你太有才了

查看全部评分

发表于 2025-1-30 11:14 |显示全部楼层
此文章由 happyheros 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 happyheros 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dunkerlc 发表于 2025-1-30 09:58
仔细看了,您这里面错误不少

1, Deepseek绕开了CUDA,直接用PTX中间语言写的代码。

非常欣赏有深度/技术性的专业回复
坐在簾後細把鳳聲傳,屠龍正是她下旨

发表于 2025-1-30 11:15 |显示全部楼层
此文章由 InTheEnd 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 InTheEnd 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dunkerlc 发表于 2025-1-30 10:58
仔细看了,您这里面错误不少

1, Deepseek绕开了CUDA,直接用PTX中间语言写的代码。
figtree1 发表于 2025-1-30 07:19
专业人士都认同DS的创新成果和巨大的成功。
即使是美国的反华政客也只能从国家安全角度,或者没有证据的知 ...


Microsoft今天将中国AI Company DeepSeek的R1车型带到其Azure AI Foundry平台和GitHub。 现在已成为Azure AI Foundry和Github上的模型目录的一部分- 允许Microsoft的客户将其集成到他们的AI申请。


从现在的消息看,我感觉DS基本靠谱,可能在英伟达的芯片数量和模型上有夸大,但是模型大差不差

https://www.theverge.com/news/60 ... e-ai-foundry-github
Advertisement
Advertisement

发表于 2025-1-30 11:18 |显示全部楼层
此文章由 kanweng 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 kanweng 所有!转贴必须注明作者、出处和本声明,并保持内容完整
figtree1 发表于 2025-1-30 10:16
灵魂提问,

如果我们突然制造出一种每加仑可行驶 10000 英里的汽车,但它仍然是一种汽油车,你会购买更多 ...

你的研发成本?制造成本?规模效应? 市场定价是多少?

据说有个贾老板在美国造车。也很牛逼的不行不行的。。。 不知道现在市场上有买的多少。

发表于 2025-1-30 11:20 |显示全部楼层
此文章由 dunkerlc 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dunkerlc 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 dunkerlc 于 2025-1-30 11:30 编辑
InTheEnd 发表于 2025-1-30 11:15
Microsoft今天将中国AI Company DeepSeek的R1车型带到其Azure AI Foundry平台和GitHub。 现在已成为Azu ...


我也不觉得DS在英伟达芯片数量上有夸大。

你想啊,母公司2015年成立,做量化交易的,我相信像Alexandr Wang所说中间会买几万片满血版H100,这个细节和整个研发过程肯定是不会公开的。

而最后的这2048片残血版H800,必定是模型成功做出来了,在评估训练模型成本的时候得出的结论。

说白了,一个是研发成本,一个是训练成本,天壤之别。

发表于 2025-1-30 11:29 |显示全部楼层
此文章由 android 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 android 所有!转贴必须注明作者、出处和本声明,并保持内容完整
如果真的可以在非CUDA的平台进行同等性能(tokens/s)的AI推演
那英伟达的黄金时代就结束了
可惜现在还没有

发表于 2025-1-30 11:31 |显示全部楼层
此文章由 InTheEnd 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 InTheEnd 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dunkerlc 发表于 2025-1-30 11:20
我也不觉得DS在英伟达芯片数量上有夸大。

你想啊,母公司2015年成立,做量化交易的,中间必然会买几万片 ...

中国有大量走私的英伟达芯片,新闻不是说过华强北都能买到 ,很多二手商人靠这个发财

没什么可大惊小怪的,你以为金正恩的迈巴赫哪来的,女儿的Gucci大衣网购的吗

硬件在研究发展中必不可少的,好比导弹,你得拿到对方的图纸,研究才能突破,从零太难了,任何技术都不能从零开始,没有必要,也是不正确的方式方法

发表于 2025-1-30 11:32 来自手机 |显示全部楼层
此文章由 凯瑟琳琳 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 凯瑟琳琳 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dunkerlc 发表于 2025-1-30 10:58
仔细看了,您这里面错误不少

1, Deepseek绕开了CUDA,直接用PTX中间语言写的代码。

1. ‘DeepSeek绕开CUDA,直接用PTX写代码’
PTX是是英伟达CUDA架构下的中间语言,本质上DeepSeek还是跑在英伟达的GPU上。你可以说它没用CUDA的高层API,但底层用的还是英伟达的架构,就像你换了种语言写程序,但运行的还是同样的CPU,结果没变。

2. ‘OpenAI没法蒸馏,因为它是第一个大模型’
你说OpenAI没用蒸馏,因为它没有老师。DeepSeek现在能用蒸馏,是因为它可以从OpenAI、谷歌这些模型里学习。如果OpenAI愿意,它当然也可以蒸馏自己的大模型,去做轻量版。技术是现成的,只是用不用的问题,不能因为DeepSeek用了,就当成它独家的突破。

3. ‘DeepSeek重新定义了AI的能耗模式’
现在的AI行业,早就不是OpenAI一家‘电动车’了,Anthropic、谷歌、Mistral,哪家不是在想办法降本增效?说DeepSeek是第一个发现‘AI不一定要巨费电’的,好像有点刻意拔高了。更何况,DeepSeek还是在英伟达的GPU上训练的,‘省算力’更多是在推理阶段,训练该烧的电,一点没少。

‘星星之火,可以燎原’,燎原的前提,是这火得真能烧起来。当年元宇宙火遍全球,NFT喊着‘改变世界’,区块链说要‘去中心化一切’,情绪拉满,最后还是被现实拍回去。

‘一花独放不是春,百花齐放春满园’,但问题是,现在DeepSeek这朵花连是不是塑料的都还没搞清楚。

评分

参与人数 1积分 +8 收起 理由
大杨树 + 8 偶对你的景仰如滔滔江水

查看全部评分

Advertisement
Advertisement

发表于 2025-1-30 11:56 |显示全部楼层
此文章由 dunkerlc 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dunkerlc 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 dunkerlc 于 2025-1-30 12:22 编辑
凯瑟琳琳 发表于 2025-1-30 11:32
1. ‘DeepSeek绕开CUDA,直接用PTX写代码’
PTX是是英伟达CUDA架构下的中间语言,本质上DeepSeek还是跑在 ...


PTX是是英伟达CUDA架构下的中间语言,本质上DeepSeek还是跑在英伟达的GPU上。你可以说它没用CUDA的高层API,但底层用的还是英伟达的架构,就像你换了种语言写程序,但运行的还是同样的CPU,结果没变。
您这有点想当然了,中间语言的意思是处在CUDA和GPU之间,PTX是汇编语言,从层级来讲,已经在CUDA下面了,直接和GPU对话了,压根没有用到CUDA。换句话说,换成AMD,Intel,甚至摩尔线程的GPU,也能用。这也是首发就能支持华为升腾平台的最根本原因。

你说OpenAI没用蒸馏,因为它没有老师。DeepSeek现在能用蒸馏,是因为它可以从OpenAI、谷歌这些模型里学习。如果OpenAI愿意,它当然也可以蒸馏自己的大模型,去做轻量版。技术是现成的,只是用不用的问题,不能因为DeepSeek用了,就当成它独家的突破。
OpenAI不仅愿意,而且一直在用,o1-mini,4o-mini都是。但是不好意思,用了也不敢宣称只用2048块H800训练两个月就行。

现在的AI行业,早就不是OpenAI一家‘电动车’了,Anthropic、谷歌、Mistral,哪家不是在想办法降本增效?说DeepSeek是第一个发现‘AI不一定要巨费电’的,好像有点刻意拔高了。更何况,DeepSeek还是在英伟达的GPU上训练的,‘省算力’更多是在推理阶段,训练该烧的电,一点没少。
同意,大家都在降本增效,大家都在用模型蒸馏,但是没有一家宣称自己只有2048块H800训练两个月就能跑到lmarena前三!

‘星星之火,可以燎原’,燎原的前提,是这火得真能烧起来。当年元宇宙火遍全球,NFT喊着‘改变世界’,区块链说要‘去中心化一切’,情绪拉满,最后还是被现实拍回去。
这个有点偷换概念了吧。。。我的意思是DS出来,大家的关注点会从英伟达身上移开。业内人士停止无脑堆算力,我国内广汽做大数据的朋友昨天就告诉我,他们年前立项的5000多万大模型项目已经被紧急叫停了。

‘一花独放不是春,百花齐放春满园’,但问题是,现在DeepSeek这朵花连是不是塑料的都还没搞清楚
已经开源了,到现在为止快30万的下载量了,各大AI机构拿着显微镜都不知道扫描多少遍了。还是那句话,也许DS马上会淹没,但是精神永存。

评分

参与人数 3积分 +12 收起 理由
charlestcm + 4 感谢分享
石堡 + 6 感谢分享
iamabird2 + 2 谢谢奉献

查看全部评分

发表于 2025-1-30 12:04 来自手机 |显示全部楼层
此文章由 石堡 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 石堡 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dunkerlc 发表于 2025-1-30 11:56
PTX是是英伟达CUDA架构下的中间语言,本质上DeepSeek还是跑在英伟达的GPU上。你可以说它没用CUDA的高层AP ...

国外大厂有用别家数据蒸馏的吗?
国内大厂有从基础做起的吗?似乎豆包说他们不用蒸馏。

发表于 2025-1-30 12:07 |显示全部楼层
此文章由 dunkerlc 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dunkerlc 所有!转贴必须注明作者、出处和本声明,并保持内容完整
石堡 发表于 2025-1-30 12:04
国外大厂有用别家数据蒸馏的吗?
国内大厂有从基础做起的吗?似乎豆包说他们不用蒸馏。 ...

看看GPT的回答吧

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

评分

参与人数 1积分 +4 收起 理由
石堡 + 4 感谢分享

查看全部评分

发表于 2025-1-30 12:11 |显示全部楼层
此文章由 axiaobug 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 axiaobug 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dunkerlc 发表于 2025-1-30 11:56
PTX是是英伟达CUDA架构下的中间语言,本质上DeepSeek还是跑在英伟达的GPU上。你可以说它没用CUDA的高层AP ...

我能够想象到DS的PTX加上华为自己写个编译器,是不是可以使用昇腾了?

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部