新足迹

 找回密码
 注册

精华好帖回顾

· 味道不错的肉酱手扯面~~ (2005-6-17) liz · 回忆旅行——伦敦游记(所有坑都填完啦!!!!) (2008-2-5) xingbu
· 柬埔寨之旅 – 高温+日均2万步来看吴哥之美 (2019-12-31) 缓缓 · Lanshan:瑞典味道之八-给春天的礼物-惊艳的 Chocolate Swirl Cheesecake (详细流程图)剖面图来了 (2011-10-26) lanshan
Advertisement
Advertisement
12
返回列表 发新帖
楼主:dootbear

DeepSeek冒起暴露了英伟达的弱点 [复制链接]

发表于 2025-1-30 12:13 |显示全部楼层
此文章由 dunkerlc 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dunkerlc 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 dunkerlc 于 2025-1-30 12:21 编辑
axiaobug 发表于 2025-1-30 12:11
我能够想象到DS的PTX加上华为自己写个编译器,是不是可以使用昇腾了?


是的,我个人觉得这个是比成本更NB的存在。也是英伟达股票下滑的关键。

而且DS已经官方宣布支持升腾平台了。

知乎都讨论几天了

https://www.zhihu.com/question/10446977348

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
Advertisement
Advertisement

发表于 2025-1-30 12:14 来自手机 |显示全部楼层
此文章由 石堡 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 石堡 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dunkerlc 发表于 2025-1-30 12:07
看看GPT的回答吧

Ds算法和技术有突破是肯定的。问题似乎是版权问题。
上边这些家是不是多在自己的基础大模型上蒸馏?

发表于 2025-1-30 12:18 |显示全部楼层
此文章由 fabrica 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 fabrica 所有!转贴必须注明作者、出处和本声明,并保持内容完整
开源技术使得大幅优化是可能的,英伟达一家独大这种模式应该被摧毁。

且不说ds的好坏,但这么快就又使出什么“国家安全” “偷窃”之类的的杀手锏,的确太仓促了,说明真的慌了。

还有,这个ds一出,没人关注什么tiktoc的事情了,和人工智能相比,这些东西也是比较鸡肋的事情,也是大写的尴尬。

发表于 2025-1-30 12:26 |显示全部楼层
此文章由 dunkerlc 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dunkerlc 所有!转贴必须注明作者、出处和本声明,并保持内容完整
石堡 发表于 2025-1-30 12:14
Ds算法和技术有突破是肯定的。问题似乎是版权问题。
上边这些家是不是多在自己的基础大模型上蒸馏? ...

大多的确是蒸馏自己的基础大模型,但是蒸馏别家的情况也存在

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

评分

参与人数 1积分 +6 收起 理由
石堡 + 6 感谢分享

查看全部评分

发表于 2025-1-30 12:30 来自手机 |显示全部楼层
此文章由 Isydney 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Isydney 所有!转贴必须注明作者、出处和本声明,并保持内容完整
暴露弱点是好事,早点警惕起来

发表于 2025-1-30 12:33 来自手机 |显示全部楼层
此文章由 石堡 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 石堡 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dunkerlc 发表于 2025-1-30 12:26
大多的确是蒸馏自己的基础大模型,但是蒸馏别家的情况也存在

看来openai是你挑战到我了,就算一算帐。不如我的话姑且听之任之。
Advertisement
Advertisement

发表于 2025-1-30 12:44 |显示全部楼层
此文章由 axiaobug 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 axiaobug 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dunkerlc 发表于 2025-1-30 12:13
是的,我个人觉得这个是比成本更NB的存在。也是英伟达股票下滑的关键。

而且DS已经官方宣布支持升腾平台 ...

感觉最后还是靠算力,但是关键是可以不需要CUDA环境,那么我堆算力nv不是唯一选择,比如摩尔线程,AMD,Intel,华为都在算力名单上。这也解释N家股票跌那么多。

发表于 2025-1-30 15:02 |显示全部楼层
此文章由 nvy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 nvy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
凯瑟琳琳 发表于 2025-1-30 09:15
如果DeepSeek的低训练成本是真的,那首先该被颠覆的就不是英伟达,而是OpenAI。因为这等于有人用500块造出 ...

内燃机普及化不是因为效率,是因为便宜,是因为价钱。

发表于 2025-1-30 15:04 |显示全部楼层
此文章由 nvy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 nvy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
axiaobug 发表于 2025-1-30 12:44
感觉最后还是靠算力,但是关键是可以不需要CUDA环境,那么我堆算力nv不是唯一选择,比如摩尔线程,AMD,I ...

主要是溢价实在太多,比2个特斯拉还贵。

发表于 2025-1-30 15:06 |显示全部楼层
此文章由 fabrica 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 fabrica 所有!转贴必须注明作者、出处和本声明,并保持内容完整
nvy 发表于 2025-1-30 15:04
主要是溢价实在太多,比2个特斯拉还贵。

历史上看不管是软件还是硬件都不肯能一家独大的,必须打破。

发表于 2025-1-30 15:08 |显示全部楼层
此文章由 nvy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 nvy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
石堡 发表于 2025-1-30 12:14
Ds算法和技术有突破是肯定的。问题似乎是版权问题。
上边这些家是不是多在自己的基础大模型上蒸馏? ...

不是版权,是找茬。DS是用开源的,主要你也开源就没问题。OpenAI是说你用我来帮你蒸馏,不行。
Advertisement
Advertisement

发表于 2025-1-30 15:08 |显示全部楼层
此文章由 liangyu42087 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 liangyu42087 所有!转贴必须注明作者、出处和本声明,并保持内容完整
凯瑟琳琳 发表于 2025-1-30 09:15
如果DeepSeek的低训练成本是真的,那首先该被颠覆的就不是英伟达,而是OpenAI。因为这等于有人用500块造出 ...

y1s1,这次open ai 可能要完。

外网很多人都说这次是open ai被rug pull (釜底抽薪)。。。。。

发表于 2025-1-30 15:09 |显示全部楼层
此文章由 nvy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 nvy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
fabrica 发表于 2025-1-30 15:06
历史上看不管是软件还是硬件都不肯能一家独大的,必须打破。

一家就变成收税了,微软和苹果就是。

发表于 2025-1-30 15:14 |显示全部楼层
此文章由 nvy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 nvy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
fabrica 发表于 2025-1-30 12:18
开源技术使得大幅优化是可能的,英伟达一家独大这种模式应该被摧毁。

且不说ds的好坏,但这么快就又使 ...

AI是国之根本,国之存亡。tiktok真是算娱乐圈了。

发表于 2025-1-30 17:24 来自手机 |显示全部楼层
此文章由 maxinfang 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 maxinfang 所有!转贴必须注明作者、出处和本声明,并保持内容完整
open ai 有芯片 但是电费贵 基建卡住了 再开源成本太高 可以理解为啥要开始收费 毕竟跑一次电价差距太大
头像被屏蔽

禁止发言

发表于 2025-1-30 17:46 |显示全部楼层
此文章由 InTheEnd 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 InTheEnd 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 InTheEnd 于 2025-1-30 17:48 编辑

足迹习惯政治化,所以把DS和OpenAI当作中美对立,各种对比,忽略了除了OpenAI的,还有很多其他AI平台,比如谷歌的Gemini, 脸书的,这都是OpenAI竞争对手

大家对比一下Gemini和DS的答案,真的是肉眼可见的差距,谷歌团队会不会研究DS来优化Gemini?来追赶OpenAI

脸书据说已经在这么做了


Advertisement
Advertisement

发表于 2025-1-30 17:54 |显示全部楼层
此文章由 nvy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 nvy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
shouter 发表于 2025-1-30 10:39
不是抬杠哈, 我也不太看好nvidia的后市
但是就这个提问的假设而言, 还是需要量化分析, 不能只是定性地 ...

N卡已经到达了一个极高门槛的程度了,俗话叫“赢者全拿”,AMD已经完全没有能力抗衡。唯一的可能就是“制裁”,人为分开N卡,让弱者有一个成长空间。

发表于 2025-1-30 17:55 |显示全部楼层
此文章由 nvy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 nvy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
maxinfang 发表于 2025-1-30 17:24
open ai 有芯片 但是电费贵 基建卡住了 再开源成本太高 可以理解为啥要开始收费 毕竟跑一次电价差距太大 ...

不收费?每年投50亿美元进去是为了做公益吗?

发表于 2025-1-30 17:57 |显示全部楼层
此文章由 nvy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 nvy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
InTheEnd 发表于 2025-1-30 17:46
足迹习惯政治化,所以把DS和OpenAI当作中美对立,各种对比,忽略了除了OpenAI的,还有很多其他AI平台,比如 ...

脸书哪个是开源的,DS很可能就是建立在脸书哪个的基础上。OpenAI和谷歌等等是不可以用的,用就是侵权。

发表于 2025-1-30 18:11 |显示全部楼层
此文章由 oed 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 oed 所有!转贴必须注明作者、出处和本声明,并保持内容完整
笑话,那有担心工具太高级太先进而影响销量的!

发表于 2025-1-30 18:37 |显示全部楼层
此文章由 nvy 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 nvy 所有!转贴必须注明作者、出处和本声明,并保持内容完整
oed 发表于 2025-1-30 18:11
笑话,那有担心工具太高级太先进而影响销量的!

如果用便宜的工具也能干贵10倍的工具的活,有可能贵的工具就卖不出去了。
Advertisement
Advertisement
头像被屏蔽

禁止发言

发表于 2025-1-30 18:58 |显示全部楼层
此文章由 InTheEnd 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 InTheEnd 所有!转贴必须注明作者、出处和本声明,并保持内容完整
nvy 发表于 2025-1-30 17:55
不收费?每年投50亿美元进去是为了做公益吗?

去年烧了80亿,微软刚刚追加投资7.5亿,现在微软投了150亿进去了
头像被屏蔽

禁止发言

发表于 2025-1-30 19:00 |显示全部楼层
此文章由 InTheEnd 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 InTheEnd 所有!转贴必须注明作者、出处和本声明,并保持内容完整
nvy 发表于 2025-1-30 17:57
脸书哪个是开源的,DS很可能就是建立在脸书哪个的基础上。OpenAI和谷歌等等是不可以用的,用就是侵权。 ...

小札团队现在试图用DS来优化LLM

发表于 2025-1-30 19:43 |显示全部楼层
此文章由 空山鸟语 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 空山鸟语 所有!转贴必须注明作者、出处和本声明,并保持内容完整
在twitter上有个叫“初码”的人发了一个爆论:整个AI行业就是个草台班子,别看那些大厂今天出个这明天出个那,其实都是一些无足轻重的改进,很少有真正让人眼前一亮的巧思。对此我深以为然。不管在哪里都是普通人居多,天才凤毛麟角。大公司也一样。它的的制度设计都是为了针对普通人设计的,而不是倾向于发现天才、让天才充分发挥。即便在这些号称技术导向的大厂也是一样无法做到真的唯才是举。这跟普通人的印象大相径庭,因为一般来说大厂更难进入,待遇更高,人员的学历更高。但是其实问题同样存在,否则的话IBM、爱立信、北电、诺基亚这些名厂就不会悲催地失败了。

举个例子,两天前Deepseek发布了Janus Pro。在它的技术报告里提到,几乎所有的图像生成模型都会把三分之二的训练时间放在imagenet这个数据集上。但是他们发现这个数据集的质量其实不够好,基于它训练模型会导致性能下降。他们在训练过程中丢弃这个数据集,结果导致训练时间大大加快,模型性能大大提高。这就很有意思了,为什么那么多其他公司这么多年就发现不了数据的质量问题呢?可见真的是庸人比较多。

我今天刚刚在火车上听了梁文峰的访谈。我感觉Deepseek绝对是个不可复制的以天才为核心的公司。它的技术实力的确是远超一般的大型公司。它跟传统大公司在技术上比拼就好像李小龙的截拳道一般,其他公司基本没有太多机会。但是这种风格的公司在规模比较小的时候比较容易成功,但是很难扩张,也很难长期保持。我不确定深度求索这种极致追求技术的文化能够保持多久。这其实是他们最大的风险。失去这种文化,他就会成为一个平庸的公司。

发表于 2025-1-30 19:50 |显示全部楼层
此文章由 xji 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xji 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 xji 于 2025-1-30 19:51 编辑

我同意这个逻辑:

Deepseek并没有证明用低算力可以达到同样效果甚至更好,网上不少测评,deepseek还是比gpt差一些,可以用但还不够好。也就是说最好的大模型仍然要靠算力堆上去。为了突破模型效能,大家还必须继续堆算力。

另一方面,很多小厂本来没能力搞大模型,利用deepseek的技术,现在可以搞自己的模型了,这些小厂从原来根本没办法进场,到现在有了入场券,也可以购买一定的算力玩这个游戏了。这些小厂对算力需求反而增加了。

如此一来,大厂还必须堆算力不断突破模型能力上限,小厂增加算力需求,总体来说对算力的需求反而还上升了,对英伟达仍然利好。

如果哪一天大家发现突破模型能力上限不需要用这么多算力,大厂对算力的需求开始下降,那就可能危及英伟达。但好像现在还无法得出这个结论吧?目前最好的大模型还是gpt的o3 pro,deepseek的成绩并不能证明只需要较少成本就能突破o3 pro的上限。何况o3 pro也还不够好,还有很多上升空间,对算力的需求仍然是越多越好。

发表于 2025-1-30 20:46 |显示全部楼层
此文章由 oed 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 oed 所有!转贴必须注明作者、出处和本声明,并保持内容完整
nvy 发表于 2025-1-30 18:37
如果用便宜的工具也能干贵10倍的工具的活,有可能贵的工具就卖不出去了。 ...

天下还有这可能?
Advertisement
Advertisement

发表于 2025-1-30 20:56 |显示全部楼层
此文章由 oed 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 oed 所有!转贴必须注明作者、出处和本声明,并保持内容完整
nvy 发表于 2025-1-30 18:37
如果用便宜的工具也能干贵10倍的工具的活,有可能贵的工具就卖不出去了。 ...

讲神话呢。。。不可否认这次DS的贡献,他们把AI推上一个台阶,加快人工智能的进程,释放原来的大AI厂的更多潜能,但是随着人工智能的进程的加快需求的算力将更大。

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部