金融时报:小型中国AI初创公司DeepSeek震惊硅谷 尽管美国试图阻止中国的高科技野心,对冲基金亿万富翁梁文锋(Liang Wenfeng)在有限的预算下成功构建了一个AI模型。 小型实验室突破性成果引发轰动 本周,一家小型中国人工智能实验室发布了其尖端模型的技术细节,震惊了世界,也让其隐秘的创始人梁文峰成为民族英雄。他的成功挑战了美国阻止中国高科技发展的企图。 DeepSeek由对冲基金经理梁文峰创立,本周一发布了其R1模型,并在一篇详细的论文中解释了如何在有限预算下构建一个大型语言模型。 这个模型能够自动学习和改进,无需人工监督。 硅谷争论技术优势是否能保持 美国公司如OpenAI和Google DeepMind率先在推理模型领域取得进展。推理模型是一项较新的AI研究领域,旨在使模型达到人类认知能力的水平。然而,尽管旧金山的OpenAI去年12月发布了其完整的o1模型,但并未公开其方法。 DeepSeek的R1模型发布后,在硅谷引发了激烈的争论。人们质疑美国资源更丰富的AI公司如Meta和Anthropic,是否能维持其技术优势。 梁文峰成民族骄傲 与此同时,梁文峰在中国国内成为国家自豪的象征。 本周,他是唯一受邀参加与中国第二号领导人李强会面的一位AI领域领袖。会议强调企业家要“集中精力攻克关键核心技术”。 非传统路径助力成功 梁文峰的AI项目始于2021年。当时他经营量化交易基金High-Flyer,同时购买了数千块英伟达图形处理单元(GPU)。 业界人士起初认为这是一个亿万富翁的“业余爱好”。 一位商业合作伙伴回忆道:“我们第一次见到他时,他看起来是个发型糟糕的书呆子,一直谈论要用一万个芯片建一个集群来训练模型。我们当时并未把他当回事。” 梁文峰在AI领域的“局外人”身份反而成为了他的优势。 他在High-Flyer积累了利用AI和算法识别股市模式的财富,同时团队也精通使用英伟达芯片进行交易。 2023年,他正式创立DeepSeek,并宣布要开发人类水平的AI。 芯片限制倒逼创新 在美国禁止英伟达将最先进芯片出口到中国后,当地AI公司不得不创新利用有限的国内芯片算力。 而梁文峰的团队早已掌握了如何最大化芯片性能。 DeepSeek的工程师擅长挖掘GPU的潜力,即使这些芯片不是最先进的。 这使得DeepSeek成为一个专注于研究的强大竞争者。 专注研究的模式 DeepSeek并未接受外部融资,也未将其模型进行大规模商业化。北京的一位AI投资者将其形容为“像DeepMind早期的样子”,完全专注于研究与工程。 梁文锋亲自参与DeepSeek的研究,他也用量化交易基金的收益为DeepSeek支付高薪。 与TikTok所有者字节跳动一样,DeepSeek以在中国为AI工程师提供最高薪酬而闻名,员工分布在杭州和北京的办公室。 他的团队汇集了来自北京大学,清华大学和北京航空航天大学的顶尖人才,而不是依赖海外专家。 在去年接受国内媒体采访时,他表示他的核心团队“没有从海外归来的人。他们都是本土人才,我们必须自己培养顶尖人才。” DeepSeek作为一家纯粹的中国大型语言模型公司,赢得了国内的赞誉。 这位商业伙伴说。“团队相信梁文锋的愿景:向世界展示中国人可以具有创造力,并从零开始构建一些东西。” 有限资源的成功训练 DeepSeek声称,仅用2048块英伟达H800芯片和560万美元,便训练出了一个拥有6710亿参数的模型,而这只是OpenAI和Google开发类似规模模型成本的一小部分。 加州大学伯克利分校的AI政策研究员Ritwik Gupta表示,DeepSeek最近的模型发布表明,“在AI能力方面没有护城河”。 他说,“第一个训练模型的人必须花费大量资源才能达到目标。但后来者可以以更低的成本和更快的速度达到同样的目标。” Gupta补充说,中国在系统工程师方面的人才库比美国大得多,他们更了解如何充分利用计算资源,以更低的成本训练和运行模型。 未来挑战与竞争 尽管DeepSeek用有限资源取得了令人印象深刻的成果,但业内人士认为,随着行业演变,其竞争力能否持续仍是未知数。 High-Flyer的投资回报在2024年有所下降,一位接近梁文峰的人士表示,这是因为梁将大部分精力放在了DeepSeek上。而与此同时,美国竞争对手正在扩大下一代芯片集群的规模。 本周,OpenAI宣布与日本软银(SoftBank)成立合资企业“Stargate”,计划投资至少一千亿美元用于AI基础设施。马斯克的xAI正在大规模扩展其Colossus超级计算机,以容纳超过一百万个GPU,以帮助训练其Grok AI模型。 尽管DeepSeek目前拥有中国最大的先进计算集群之一,但梁文峰的商业伙伴坦言:“现在资源足够,但未来可能会面临压力。” 来源: https://www.ft.com/content/747a7b11-dcba-4aa5-8d25-403f56216d7e Eleanor Olcott in Beijing and Zijing Wu in Hong Kong January 24 2025 |