新足迹

 找回密码
 注册

精华好帖回顾

· 就这样把自己吃胖系列之三 (2005-10-29) 小米 · 面模篇 (2005-1-27) 短腿小鳄鱼
· Mornington Peninsula,Portsea悠闲一日游 (2009-4-3) edith921 · 澳洲半年3份工 (2005-7-17) 童心的魔镜
Advertisement
Advertisement
查看: 813|回复: 11

[北美] OpenAI推出具有“推理”能力的新系列AI模型 [复制链接]

2012年度奖章获得者 2013年度奖章获得者

发表于 2024-9-13 07:59 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
路透社:OpenAI推出具有“推理”能力的新系列AI模型

路透社9月12日消息,由微软支持的OpenAI周四表示,公司推出了名为“Strawberry”(草莓)系列的AI模型,这些模型旨在花更多时间处理查询的答案,以解决复杂问题。

据路透社首次报道,这些新模型能够进行复杂任务的推理,比以前的模型在科学,编程和数学等领域能够解决更具挑战性的问题。

OpenAI内部将该项目称为“草莓”,而周四宣布的模型被命名为o1和o1-mini。

公司表示,o1模型将从周四起在ChatGPT及其API中提供。

专注于改进公司模型推理能力的OpenAI研究员布朗(Noam Brown)在社交媒体平台X上确认,这些模型与“草莓”项目相同。

布朗写道:“我很高兴与大家分享我们在OpenAI努力创造真正具有通用推理能力的AI模型的成果。”

在其博客文章中,OpenAI表示,o1模型在国际数学奥林匹克竞赛(International Mathematics Olympiad)资格考试中取得了83%的得分,而其之前的模型GPT-4o的得分为13%。

公司还表示,该模型在竞赛编程问题上的表现有所提升,并在科学问题基准测试中超越了人类博士水平的准确度。

布朗表示,这些模型通过一种称为“思维链”(chain-of-thought)的推理技术取得了这些成绩,该技术涉及将复杂问题分解为更小的逻辑步骤。

研究人员指出,当将这种方法用作提示技术时,AI模型在解决复杂问题时的表现往往会得到改善。

OpenAI现在已将这种能力自动化,使模型能够自主分解问题,而无需用户提示。

OpenAI表示,“我们训练这些模型在回答之前花更多时间思考问题,就像人类一样。通过训练,它们学习精炼思维过程,尝试不同的策略,并识别自己的错误”。

路透社于2023年11月首次报道了OpenAI的推理项目,当时该项目被称为Q*。2024年7月的报道中,项目已被称为草莓。







来源:

https://www.reuters.com/technolo ... roblems-2024-09-12/

By Katie Paul and Anna Tong
September 13, 20244:28 AM GMT+10Updated 2 hours ago


仰望星空:南风车星系M83
M63南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。
Advertisement
Advertisement

2012年度奖章获得者 2013年度奖章获得者

发表于 2024-9-13 08:00 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整

本文要点:

1. OpenAI推出了“草莓”系列的新AI模型,具备更强的推理能力,可以解决复杂问题。

2. 新模型在国际数学奥林匹克竞赛资格考试中取得了83%的高分,并在科学和编程问题的表现上超过了人类博士水平。

3. 模型使用“思维链”推理技术,自动化分解复杂问题,学习优化思维过程和识别错误。

仰望星空:南风车星系M83
M63南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。

发表于 2024-9-13 09:11 来自手机 |显示全部楼层
此文章由 zigzag 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 zigzag 所有!转贴必须注明作者、出处和本声明,并保持内容完整
图2看着瘆人。

发表于 2024-9-13 09:17 来自手机 |显示全部楼层
此文章由 fiony 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 fiony 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 fiony 于 2024-9-13 08:21 编辑

https://community.openai.com/t/i ... trawberry/829618/16

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

评分

参与人数 1积分 +4 收起 理由
yacobe + 4

查看全部评分

发表于 2024-9-13 09:25 |显示全部楼层
此文章由 xzhang 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xzhang 所有!转贴必须注明作者、出处和本声明,并保持内容完整
ChatGPT说这个成绩达到甚至超过顶尖选手的水平,不知真假

发表于 2024-9-13 09:45 |显示全部楼层
此文章由 yuxuanlin 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 yuxuanlin 所有!转贴必须注明作者、出处和本声明,并保持内容完整
据说,到2027年,AGI就会出现

AI的智商会碾压所有人类的总和。

多么期待这一天的到来,应该是可以活着看到。

然后,期待——电影——终结者的情节,在现实中一一展现。
Advertisement
Advertisement

发表于 2024-9-13 09:47 |显示全部楼层
此文章由 上书房行走 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 上书房行走 所有!转贴必须注明作者、出处和本声明,并保持内容完整
炒作。继续炒作。骗傻子。

发表于 2024-9-13 10:47 |显示全部楼层
此文章由 zpai 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 zpai 所有!转贴必须注明作者、出处和本声明,并保持内容完整
不喜欢跟草莓联系起来

发表于 2024-9-13 11:55 |显示全部楼层
此文章由 fhjp01 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 fhjp01 所有!转贴必须注明作者、出处和本声明,并保持内容完整
让 ChatGPT写些数学分数的题目,结果发现会得出一个可以接受的答案但是不可理解的过程。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x

发表于 2024-9-13 19:23 来自手机 |显示全部楼层
此文章由 MerryX 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 MerryX 所有!转贴必须注明作者、出处和本声明,并保持内容完整
让那些说AI没逻辑推理能力的人看看 学傻了一样的做了无用功也是失业
头像被屏蔽

禁止发言

发表于 2024-9-13 19:45 |显示全部楼层
此文章由 对你爱不完 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 对你爱不完 所有!转贴必须注明作者、出处和本声明,并保持内容完整
最近用Copilot,有时候答案不准确,有时候确实惊艳,一大段代码直接生成了
Advertisement
Advertisement

发表于 2024-9-13 19:54 来自手机 |显示全部楼层
此文章由 MerryX 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 MerryX 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 MerryX 于 2024-9-13 22:33 编辑
对你爱不完 发表于 2024-9-13 18:45
最近用Copilot,有时候答案不准确,有时候确实惊艳,一大段代码直接生成了


AI吊打程序员

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部