新足迹

 找回密码
 注册

精华好帖回顾

· 2016-澳洲雪山行 (2016-8-17) joy2joy · 《动物的天堂》--代替舅舅发原创帖 (2004-12-10) leeshine
· 宝宝趣事--学话趣事两则 (2007-9-26) joy4land · 中秋无家宴- 只有早饭:Oxtail Spagheti Bolognese (2010-9-22) 大胃
Advertisement
Advertisement
查看: 1102|回复: 6

[IT] 通俗地解释一下,什么是DeepSeek开源以及有什么用 [复制链接]

发表于 2025-2-9 09:16 |显示全部楼层
此文章由 leoyin2014 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 leoyin2014 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 leoyin2014 于 2025-2-9 10:33 编辑

DeepSeek号称跟其他大模型最不同就是”开源“。
但是很多同学有误解,以为拿到了开源代码,自己也能做出大模型了。

我大致看了一下它的开源代码,简单地说,其实你能做的,就是对DeepSeek大模型做各种微调,定制,蒸馏等等,但是你无法根据这些开源,来做出一个DeepSeek类似的大模型。

通俗解释就是,DeepSeek好比一个百科全书,里面什么都有,但是你用DeepSeek开源代码,只能做一些精华提炼,小百科,某些方面的知识,比如专注于法律,建筑,医疗等等的DeepSeek”精华版“。要知道DeepSeek最大的版本也有300GB,这样大的数据,运行也需要64G显存的显卡,不太可能在便携式设备上快捷使用,所谓蒸馏,就是把百科全书变成某方面小专家,你可以在机器人上运行。

”微调“,就是通过你输入一些新的训练材料,调整不同的权重,让DeepSeek在某些方面更聪明,生成一个在某些方面比原版DeepSeek更聪明的小DeepSeek。 一个比喻就是假如天龙八部这本书是DeepSeek,很多导演就开始微调,换换情节,加加人物,弄出一个新电影,本质上还是天龙八部,但是在某些方面有创新有看头,但是你让这些导演自己写本天龙八部,那是不可能的。

这里的开源代码,没有提供训练材料和方法,所以你无法真正的从头开始训练一个大模型,因为这是顶级商业机密,如果有人拿到了这种代码,可以自己训练一个”邪恶的“大模型,就会危害社会了。而且从头训练大模型,需要的资源,不是普通人能负担的,需要显卡,大量的人员来标注训练数据,以保证AI不走邪路,这不是简单的一个代码能描述的了。选择训练数据的源,都是一个商业机密,据说DeepSeek使用大量中文训练,因为中文更简练,各种词的组合很方便,所以DeepSeek拥有更高的智力和更少的训练时间。所以一般来说,你想要训练一个大模型,你要解决这两方面问题:人力和算力。

所谓训练其实也不复杂,就是练习填空,比如 天空是___色的,你让AI填空,一开始它会胡说,红色,白色,绿色,你每次都给它低分,当它回答蓝色的时候,你给高分,它就记住了,原来说蓝色,会得高分,那它以后就永远回答蓝色了。所以训练者的反馈很重要,这就是supervised training, 如果让AI自己自问自答,就是unsupervised training。  

当然,即便你训练出邪恶的AI,也会被互联网封杀,你本人也会锒铛入狱,很多国家已经立法禁止训练邪恶AI,请不要以身试法,比如有人曾经训练出合成毒品的AI,被瞬间下架。

最后,使用DeepSeek创业的方向,我认为仍在便携设备和智能体上最有意义,你研究出一些家用机器人,配置DeepSeek,可以拥有更高的智力,不止于跟你聊天,基本上可以当人使唤了。

评分

参与人数 4积分 +25 收起 理由
sz2008 + 6 感谢分享
danielweng + 5 感谢分享
挑灯亮剑 + 10 感谢分享

查看全部评分

炒币分为神、圣、侠、霸、王
请叫我币王
Advertisement
Advertisement

发表于 2025-2-9 17:14 |显示全部楼层
此文章由 sundaliang 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 sundaliang 所有!转贴必须注明作者、出处和本声明,并保持内容完整
以后siri,小爱同学啥的都会变聪明太多了吧

发表于 2025-2-9 19:57 来自手机 |显示全部楼层
此文章由 gifox 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 gifox 所有!转贴必须注明作者、出处和本声明,并保持内容完整
楼主还能看得懂开源代码,我不行

发表于 2025-2-10 07:06 |显示全部楼层
此文章由 leoyin2014 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 leoyin2014 所有!转贴必须注明作者、出处和本声明,并保持内容完整
gifox 发表于 2025-2-9 20:57
楼主还能看得懂开源代码,我不行

我要开办一人公司了,作为老板这些都应该懂
炒币分为神、圣、侠、霸、王
请叫我币王

发表于 2025-2-10 07:29 来自手机 |显示全部楼层
此文章由 挑灯亮剑 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 挑灯亮剑 所有!转贴必须注明作者、出处和本声明,并保持内容完整
靠谱

发表于 2025-2-10 07:50 |显示全部楼层
此文章由 limyae2009 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 limyae2009 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Leo哥说的靠谱,


很多人以为“开源”了就万事大吉了,我早就说过啦:别人只开源了模型参数。


这个是真正的反编译,看DS实际跑起来、训练起来是不是像其论文上说的那么“省”,这一点看很重要,否则中小公司依然要投大量的资金。

https://github.com/huggingface/open-r1


期待楼主的加入!:)

稽首天中天,毫光照大千。
八风吹不动,端坐紫金莲:)
Advertisement
Advertisement

发表于 2025-2-10 19:40 |显示全部楼层
此文章由 leoyin2014 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 leoyin2014 所有!转贴必须注明作者、出处和本声明,并保持内容完整

这个很有意思,但是我怀疑他们能出来的东西有没有真正的竞争性

反向推导数据

不如自己从头训练
炒币分为神、圣、侠、霸、王
请叫我币王

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部