新足迹

 找回密码
 注册

精华好帖回顾

· 生似樱海,死若火花 (2021-2-4) jamesadachi · PC--买地建房贴--Carlisle之Albany 35,历时4个半月,终于settle了 (2011-2-6) 可乐33
· 美泉宫里的那位硕人--《茜茜公主》 (2008-9-26) · 【三口之家 人均六刀 吃饱吃好】晚餐九:农家小炒肉、土豆炖茄子、菠菜蛋花汤 (2023-5-16) ayeeda
Advertisement
Advertisement
楼主:dootbear

[中国大陆] 中国初创公司如DeepSeek挑战全球AI巨头 [复制链接]

发表于 2025-1-26 12:39 |显示全部楼层
此文章由 对你爱不完 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 对你爱不完 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我昨天晚上还试了一个逻辑问题

我试了一道逻辑问题,过河问题,在各个平台上(DeepSeek, copilot, gemini, meta, chatgpt,grok)

只有meta答案是错的

狼、羊、白菜和一个农民要过河,只有一条小船,每次只能载两个人(包括农民)。如果狼和羊在一起,狼会吃羊;如果羊和白菜在一起,羊会吃白菜。问农民应该如何安排才能安全过河?

A wolf, a sheep, a cabbage, and a farmer need to cross a river, but there is only a small boat that can carry two people at a time (including the farmer). If the wolf and the sheep are left alone together, the wolf will eat the sheep; if the sheep and the cabbage are left alone together, the sheep will eat the cabbage. How should the farmer arrange the crossings to ensure everything gets across safely?
Advertisement
Advertisement

发表于 2025-1-26 12:45 |显示全部楼层
此文章由 joshua_cas 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 joshua_cas 所有!转贴必须注明作者、出处和本声明,并保持内容完整
凯瑟琳琳 发表于 2025-1-25 21:18
刚才去deepseek问了一下简单的算术题

解方程  x^{x^{2}} = 256 ,求 x。

不会,deepseek不仅给出了结果,还进行了验证,证明答案是正确的
反而chatgpt在一本正经的胡说八道

发表于 2025-1-26 12:46 |显示全部楼层
此文章由 mzbac 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 mzbac 所有!转贴必须注明作者、出处和本声明,并保持内容完整
足迹大神可能从来没看过deepseek 模型的结构,人家从attention 和moe的gate routing全部都是自己创新改进的,这个可以说完全自主创新,我参与了port deepseek v1, v2到mlx。 每次deepseek到模型release都是最花时间port的,因为它不是简单copy paste llama或者mistral的结构哦!!!

评分

参与人数 5积分 +21 收起 理由
roro99 + 4 感谢分享
yeshu + 3 感谢分享
welshzh + 4 感谢分享

查看全部评分

发表于 2025-1-26 12:52 |显示全部楼层
此文章由 limyae2009 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 limyae2009 所有!转贴必须注明作者、出处和本声明,并保持内容完整
凯瑟琳琳 发表于 2025-1-26 13:11
就他现在给我这种水平的回答,连gpt3年前水平都不够,可能连信息精确投喂这种最基本的任务可能都完成不了 ...

国产大部分高科技产品,包括汽车,大多是【5分实力、5分宣传】


@小红妹,你同意吗?:)

稽首天中天,毫光照大千。
八风吹不动,端坐紫金莲:)

发表于 2025-1-26 12:55 |显示全部楼层
此文章由 limyae2009 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 limyae2009 所有!转贴必须注明作者、出处和本声明,并保持内容完整
mzbac 发表于 2025-1-26 13:46
足迹大神可能从来没看过deepseek 模型的结构,人家从attention 和moe的gate routing全部都是自己创新改进的 ...

层主可以告诉大家155#结果的原因吗?


谢谢!

稽首天中天,毫光照大千。
八风吹不动,端坐紫金莲:)

发表于 2025-1-26 12:55 来自手机 |显示全部楼层
此文章由 凯瑟琳琳 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 凯瑟琳琳 所有!转贴必须注明作者、出处和本声明,并保持内容完整
mzbac 发表于 2025-1-26 13:46
足迹大神可能从来没看过deepseek 模型的结构,人家从attention 和moe的gate routing全部都是自己创新改进的 ...

一定是很先进,所以给出了这样结果。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
Advertisement
Advertisement

发表于 2025-1-26 12:56 来自手机 |显示全部楼层
此文章由 凯瑟琳琳 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 凯瑟琳琳 所有!转贴必须注明作者、出处和本声明,并保持内容完整
joshua_cas 发表于 2025-1-26 13:45
不会,deepseek不仅给出了结果,还进行了验证,证明答案是正确的
反而chatgpt在一本正经的胡说八道 ...

题目是gpt出的。

deepseek经过足迹网友昨晚反复的training现在能勉强回答不宕机啦。

发表于 2025-1-26 12:57 来自手机 |显示全部楼层
此文章由 che999 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 che999 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2025-1-25 14:16
本文要点:  

1. 中国初创公司DeepSeek推出的AI模型DeepSeek-V3以低成本实现高性能,挑战美国巨头如OpenAI ...

国内能免费用吗

发表于 2025-1-26 13:02 来自手机 |显示全部楼层
此文章由 利马克 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 利马克 所有!转贴必须注明作者、出处和本声明,并保持内容完整
凯瑟琳琳 发表于 2025-1-26 11:10
看来这个ai连稳定性都搞不好啊

好像不是稳定性的问题

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

发表于 2025-1-26 13:03 来自手机 |显示全部楼层
此文章由 凯瑟琳琳 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 凯瑟琳琳 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 凯瑟琳琳 于 2025-1-26 14:06 编辑
利马克 发表于 2025-1-26 14:02
好像不是稳定性的问题


你这是gp t

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

发表于 2025-1-26 13:04 |显示全部楼层
此文章由 limyae2009 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 limyae2009 所有!转贴必须注明作者、出处和本声明,并保持内容完整
利马克 发表于 2025-1-26 14:02
好像不是稳定性的问题

MM,换成这个问题:习近平是集权吗?


贴给我答案,我给你加分:)

稽首天中天,毫光照大千。
八风吹不动,端坐紫金莲:)
Advertisement
Advertisement

发表于 2025-1-26 13:05 来自手机 |显示全部楼层
此文章由 利马克 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 利马克 所有!转贴必须注明作者、出处和本声明,并保持内容完整
凯瑟琳琳 发表于 2025-1-26 14:03
你这是gp t

sorry,再来一张

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

发表于 2025-1-26 13:09 来自手机 |显示全部楼层
此文章由 凯瑟琳琳 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 凯瑟琳琳 所有!转贴必须注明作者、出处和本声明,并保持内容完整
limyae2009 发表于 2025-1-26 14:04
MM,换成这个问题:习近平是集权吗?



太敏感的问题,人家公司也要遵守法规,不敢回答可以理解

但是说台积电/国足成就要感谢党这种弱智回答,就是技术问题了。

发表于 2025-1-26 13:09 来自手机 |显示全部楼层
此文章由 gavinavailable 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 gavinavailable 所有!转贴必须注明作者、出处和本声明,并保持内容完整
limyae2009 发表于 2025-1-26 13:55
层主可以告诉大家155#结果的原因吗?



有些相关问题hard coded不意外,就像为什么meta可以紧急修改总统名字一样。在不同国家更具所在国政治正确训练的模型,没有什么好奇怪的。

比如我用meta的问一个clinical的问题,只是想知道这句话是不是能表现病人潜在的自杀倾向,它就完全不回答我,只是说不能回答此类问题。

但deepseek,还有别的就会分析这句话,并给出结果。

完全开源的意思就是,只要你有能力就可以把censorship给剔除掉,不一定要用网页版本,完全可以实现本地化运行。

CNBC昨天有个40分钟的专访,专门说deepseek,有的美国公司都已经搭建后台来运行了。 所有我看的测试视频都是本地运行,而不是用的网页版本。

而且,问一个你自己意识里已经确认的东西,让ai来回答,你是想证明自己是错的,还是想让ai帮你确认自己的意识是不是正常?

评分

参与人数 1积分 +2 收起 理由
limyae2009 + 2 感谢分享

查看全部评分

发表于 2025-1-26 13:11 |显示全部楼层
此文章由 limyae2009 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 limyae2009 所有!转贴必须注明作者、出处和本声明,并保持内容完整
gavinavailable 发表于 2025-1-26 14:09
有些相关问题hard coded不意外,就像为什么meta可以紧急修改总统名字一样。在不同国家更具所在国政治正确 ...

感谢分享


层主可以告诉我为什么190#和192#完全是2中测试结果吗?


或许这个可以解释的前面算法死机的问题。

稽首天中天,毫光照大千。
八风吹不动,端坐紫金莲:)

发表于 2025-1-26 13:12 来自手机 |显示全部楼层
此文章由 gavinavailable 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 gavinavailable 所有!转贴必须注明作者、出处和本声明,并保持内容完整
limyae2009 发表于 2025-1-26 14:11
感谢分享



我回答里已经回答过了,如果你看不懂两张图片的区别,那我也是对牛弹琴。
Advertisement
Advertisement

发表于 2025-1-26 13:13 |显示全部楼层
此文章由 limyae2009 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 limyae2009 所有!转贴必须注明作者、出处和本声明,并保持内容完整
gavinavailable 发表于 2025-1-26 14:12
我回答里已经回答过了,如果你看不懂两张图片的区别,那我也是对牛弹琴。 ...

本地化 VS 网络化?


哪个是本地化?
稽首天中天,毫光照大千。
八风吹不动,端坐紫金莲:)

发表于 2025-1-26 13:14 来自手机 |显示全部楼层
此文章由 凯瑟琳琳 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 凯瑟琳琳 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 凯瑟琳琳 于 2025-1-26 14:18 编辑
gavinavailable 发表于 2025-1-26 14:09
有些相关问题hard coded不意外,就像为什么meta可以紧急修改总统名字一样。在不同国家更具所在国政治正确 ...


其他AI遇到不好回答的问题,要么直接拒绝回答(比如ChatGPT对暴力问题避而不谈),要么一本正经地夹带私货输出价值观(比如问ChatGPT种族问题时,总会套一堆正确废话)。

但像‘台积电成就是靠共产党’这种弱智回答,我敢打包票,没有任何AI会说得出口。因为就算算法再差,逻辑再乱,这种程度的低级错误,正常的AI都不至于犯。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

发表于 2025-1-26 13:20 来自手机 |显示全部楼层
此文章由 飞雪888 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 飞雪888 所有!转贴必须注明作者、出处和本声明,并保持内容完整
楼上都是专业的

发表于 2025-1-26 13:22 来自手机 |显示全部楼层
此文章由 gavinavailable 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 gavinavailable 所有!转贴必须注明作者、出处和本声明,并保持内容完整
limyae2009 发表于 2025-1-26 14:13
本地化 VS 网络化?



自己动手打开网页就能知道的答案,有那么懒吗?

发表于 2025-1-26 13:22 来自手机 |显示全部楼层
此文章由 maxinfang 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 maxinfang 所有!转贴必须注明作者、出处和本声明,并保持内容完整
楼上不是说了 开源的 网页版是青少年保护板 一定要去 挑战 ph
Advertisement
Advertisement

发表于 2025-1-26 13:25 |显示全部楼层
此文章由 joshua_cas 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 joshua_cas 所有!转贴必须注明作者、出处和本声明,并保持内容完整

反复这样几次后,貌似拒绝回答了

发表于 2025-1-26 13:51 来自手机 |显示全部楼层
此文章由 ekong 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ekong 所有!转贴必须注明作者、出处和本声明,并保持内容完整
mzbac 发表于 2025-1-26 12:46
足迹大神可能从来没看过deepseek 模型的结构,人家从attention 和moe的gate routing全部都是自己创新改进的 ...

看完你的分享有两个问题想请教:
1.创新改进,是什么改进的?特指MOE的gate routing部分?
2.网上总说是蒸馏,这符合ds的情况吗?
两个问题可能有些尖锐,确实想进一步了解是什么状况。

2012年度奖章获得者 2013年度奖章获得者

发表于 2025-1-26 13:55 来自手机 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
DeepSeek也尝试做了件事:

把自家模型移植到华为昇腾910B芯片运行。

通过“动态精度调节”技术,他们在同等任务下性能损失仅5%,但成本下降70%。


发表于 2025-1-26 14:05 来自手机 |显示全部楼层
此文章由 maxinfang 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 maxinfang 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2025-1-26 14:55
DeepSeek也尝试做了件事:

把自家模型移植到华为昇腾910B芯片运行。

英伟达应声倒地

发表于 2025-1-26 14:12 来自手机 |显示全部楼层
此文章由 DataRecovery 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 DataRecovery 所有!转贴必须注明作者、出处和本声明,并保持内容完整
墙内用用挺好的,目测推广到越南泰国都有难度。
Advertisement
Advertisement

发表于 2025-1-26 14:16 来自手机 |显示全部楼层
此文章由 potter.leon 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 potter.leon 所有!转贴必须注明作者、出处和本声明,并保持内容完整
dootbear 发表于 2025-1-26 14:55
DeepSeek也尝试做了件事:

把自家模型移植到华为昇腾910B芯片运行。


Garbage in, Garbage out,再精致的内部设计也毫无意义
以有涯随无涯,殆已

发表于 2025-1-26 14:21 来自手机 |显示全部楼层
此文章由 shuobuzuji 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 shuobuzuji 所有!转贴必须注明作者、出处和本声明,并保持内容完整
ai新应用,测反智:)

发表于 2025-1-26 14:23 来自手机 |显示全部楼层
此文章由 potter.leon 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 potter.leon 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 potter.leon 于 2025-1-26 15:27 编辑
shuobuzuji 发表于 2025-1-26 15:21
ai新应用,测反智:)


嗯,智商测试器

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
以有涯随无涯,殆已

发表于 2025-1-26 14:24 |显示全部楼层
此文章由 sniper 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 sniper 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我算是看出来了,内行看门道,外行看政治。就不在一个频道上。

评分

参与人数 2积分 +7 收起 理由
Auking + 4 我很赞同
花正红 + 3 我很赞同

查看全部评分

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部