新足迹

 找回密码
 注册

精华好帖回顾

· 出水芙蓉OFFICE版 (2005-3-26) 东食西宿 · 大珠小珠落玉盘~~黑糖珍珠 地瓜圆 地瓜球 (2017-11-1) YANKS
· 参加活动,秀秀我的藏书——吃 (2011-7-21) llkk · 参加活动---我家厨房秀 (2015-12-5) chen9984
Advertisement
Advertisement
12
返回列表 发新帖
楼主:dootbear

小型中国AI初创公司DeepSeek震惊硅谷 [复制链接]

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-27 08:25 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
很多人的着眼点在于DS用很少的卡也能训练出效果差不多的模型,但这是结果,更重要的他能做到这一点的技术:

DS这次最亮眼的是证明了纯粹的outcome reward RL能够直接把模型提到o1水平,在他出来之前,业内所有人(包括deepmind)都认为需要prm (process reward model)才能做到这点。

这就已经是颠覆行业的发现了,现在所有除gpt外的llm大组,都在推倒重来,各大模型都正在copying他们的训练方法。



  
仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。
Advertisement
Advertisement

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-27 08:26 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
另外非常重要的是DS还研发出这种训练方式,甚至能够让模型自己学会longer-chain reasoning以及reflection,他们所谓“aha moment”。

相当于只训练llm得到更准确的结果,LLM就能自己学会反思,思考到一半知道自己这样做下去会错,然后尝试自己纠错。

这种模型“自我进化”的特性,是业内仅次于GPT intelligence emergence的重大发现。

仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-27 08:28 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
就结果而言,“用更少的卡训练出效果差不多的模型”可能不仅仅是节约成本这么简单,更是一种improvement of scaling law。

这意味着这种方法往上堆更多的卡,有可能把模型能力再往上提升一个数量级,甚至直接达到AGI/ASI

这就是为什么这次业内这么沸腾,DS开源的价值远大于llama,llama基本是大家已知的方法堆卡训练。

DS的研发和开源,改变了AI赛道的游戏规则,带来了太多的惊喜。

仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。

发表于 2025-1-27 08:41 |显示全部楼层
此文章由 DDD888 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 DDD888 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2025-1-27 09:25
很多人的着眼点在于DS用很少的卡也能训练出效果差不多的模型


DeepSeek Has 50,000 NVIDIA H100 AI GPUs

https://wccftech.com/chinese-ai- ... i-gpus-says-ai-ceo/

What is the truth?

发表于 2025-1-27 08:44 |显示全部楼层
此文章由 Hillsroo 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Hillsroo 所有!转贴必须注明作者、出处和本声明,并保持内容完整
太给力

发表于 2025-1-27 08:59 来自手机 |显示全部楼层
此文章由 独步闲庭 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 独步闲庭 所有!转贴必须注明作者、出处和本声明,并保持内容完整
拜登捂着不让出口的AI战略被冲击的稀巴烂。以后穷国小国也可以大展身手。
Advertisement
Advertisement

发表于 2025-1-27 08:59 来自手机 |显示全部楼层
此文章由 shuobuzuji 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 shuobuzuji 所有!转贴必须注明作者、出处和本声明,并保持内容完整
有人认为这属于踹瘸子那条好腿:)

发表于 2025-1-27 08:59 |显示全部楼层
此文章由 yybsn 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 yybsn 所有!转贴必须注明作者、出处和本声明,并保持内容完整
看到足迹首页头三条新闻全部是 中国智能AI牛逼的 新闻,我怀疑我是不是在看人民日报,头版都是习主席的消息……  

发表于 2025-1-27 09:02 |显示全部楼层
此文章由 春暖花开2020 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 春暖花开2020 所有!转贴必须注明作者、出处和本声明,并保持内容完整
太棒啦!
头像被屏蔽

禁止发言

发表于 2025-1-27 09:07 |显示全部楼层
此文章由 qzhang10 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 qzhang10 所有!转贴必须注明作者、出处和本声明,并保持内容完整
此时崩溃哥正在全网疯狂google...

发表于 2025-1-27 09:41 来自手机 |显示全部楼层
此文章由 Evo 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 Evo 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2025-1-27 08:28
就结果而言,“用更少的卡训练出效果差不多的模型”可能不仅仅是节约成本这么简单,更是一种improvement of ...

对AI没什么研究。看了红版的注解,感觉这个AI公司最大的成果是改进了AI自我学习的过程,从而有望改变业界的规则,这么理解对吗?

评分

参与人数 1积分 +4 收起 理由
dootbear + 4 你太有才了

查看全部评分

There are three types of people: those who make things happen, those who watch things happen, and those who wonder what happened.
Advertisement
Advertisement

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-27 09:50 来自手机 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Evo 发表于 2025-1-27 10:41
对AI没什么研究。看了红版的注解,感觉这个AI公司最大的成果是改进了AI自我学习的过程,从而有望改变业界 ...

Yann LeCun (Meta副总裁兼首席AI科学家)发文:

给那些看到 DeepSeek 的表现后,觉得「中国在 AI 方面正在超越美国」的人:

- 你们的解读是错的。

- 正确的解读应该是:「开源模型正在超越专有模型。」

DeepSeek 得益于开源研究和开源项目(例如 PyTorch 和来自 Meta 的 Llama)。

DS他们在他人工作的基础上,提出了新想法并进行了构建。

因为他们的工作是公开且开源的,所以每个人都能从中受益。

这就是开放研究与开源的力量!
仰望星空:南风车星系M83
M83南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。

发表于 2025-1-27 10:10 来自手机 |显示全部楼层
此文章由 凯瑟琳琳 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 凯瑟琳琳 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 凯瑟琳琳 于 2025-1-27 11:16 编辑

还是用图说话。

但像‘台积电成就是靠共产党’这种弱智回答,我敢打包票,没有任何AI会说得出口。因为就算算法再差,逻辑再乱,这种程度的低级错误,正常的AI都不至于犯。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

发表于 2025-1-27 10:19 来自手机 |显示全部楼层
此文章由 jimmyshi 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 jimmyshi 所有!转贴必须注明作者、出处和本声明,并保持内容完整
最终还是还要依赖硬件的。

发表于 2025-1-27 10:25 |显示全部楼层
此文章由 papaxiong 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 papaxiong 所有!转贴必须注明作者、出处和本声明,并保持内容完整
试试

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

发表于 2025-1-27 10:29 |显示全部楼层
此文章由 freeaubird 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 freeaubird 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2025-1-27 08:41
大家有没有发现一个问题,这一波AI浪潮,没有啥巴拉特的事儿。

为啥呢?

NVIDIA单词里面藏着INDIA,难道只有我看出来了。巴拉特早就留下记号了。

评分

参与人数 2积分 +3 收起 理由
lqbzddx + 1 NVIDIA --> NO-INDIA
shuobuzuji + 2 你太有才了

查看全部评分

Advertisement
Advertisement

发表于 2025-1-27 10:29 |显示全部楼层
此文章由 papaxiong 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 papaxiong 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我已经在的手机上下载, 并打算长期使用.
头像被屏蔽

禁止发言

发表于 2025-1-27 10:48 |显示全部楼层
此文章由 happyheros 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 happyheros 所有!转贴必须注明作者、出处和本声明,并保持内容完整
freeaubird 发表于 2025-1-27 10:29
NVIDIA单词里面藏着INDIA,难道只有我看出来了。巴拉特早就留下记号了。

笑喷了
签名被屏蔽

发表于 2025-1-27 11:36 |显示全部楼层
此文章由 roro99 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 roro99 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我的前同事去了meta,他昨天发朋友圈说 Meta AI几乎一半人这周末都在war room研究DS发布的论文。。。

发表于 2025-1-28 07:36 |显示全部楼层
此文章由 来自北方 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 来自北方 所有!转贴必须注明作者、出处和本声明,并保持内容完整
一个月前就发布了,不过这几天西方媒体才关注,有人就受不了了。赶紧把头埋在沙子里吧!

评分

参与人数 1积分 +4 收起 理由
香蕉片 + 4 感谢分享

查看全部评分

发表于 2025-1-28 22:07 来自手机 |显示全部楼层
此文章由 yxfc2003 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 yxfc2003 所有!转贴必须注明作者、出处和本声明,并保持内容完整
梁的基金如果做空了美股,轻松收割1000亿美元
Advertisement
Advertisement

发表于 2025-1-29 09:25 |显示全部楼层
此文章由 dunkerlc 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dunkerlc 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 dunkerlc 于 2025-1-31 18:25 编辑

1

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部