精华好帖回顾
· 就这样把自己吃胖系列之三 (2005-10-29) 小米	· 面模篇 (2005-1-27) 短腿小鳄鱼
· Mornington Peninsula，Portsea悠闲一日游 (2009-4-3) edith921	· 澳洲半年3份工 (2005-7-17) 童心的魔镜

查看: 813|回复: 11

[北美] OpenAI推出具有“推理”能力的新系列AI模型 [复制链接]

发表于 2024-9-13 07:59 |显示全部楼层

此文章由 dootbear 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 dootbear 所有！转贴必须注明作者、出处和本声明，并保持内容完整

路透社：OpenAI推出具有“推理”能力的新系列AI模型

路透社9月12日消息，由微软支持的OpenAI周四表示，公司推出了名为“Strawberry”（草莓）系列的AI模型，这些模型旨在花更多时间处理查询的答案，以解决复杂问题。

据路透社首次报道，这些新模型能够进行复杂任务的推理，比以前的模型在科学，编程和数学等领域能够解决更具挑战性的问题。

OpenAI内部将该项目称为“草莓”，而周四宣布的模型被命名为o1和o1-mini。

公司表示，o1模型将从周四起在ChatGPT及其API中提供。

专注于改进公司模型推理能力的OpenAI研究员布朗（Noam Brown）在社交媒体平台X上确认，这些模型与“草莓”项目相同。

布朗写道：“我很高兴与大家分享我们在OpenAI努力创造真正具有通用推理能力的AI模型的成果。”

在其博客文章中，OpenAI表示，o1模型在国际数学奥林匹克竞赛（International Mathematics Olympiad）资格考试中取得了83%的得分，而其之前的模型GPT-4o的得分为13%。

公司还表示，该模型在竞赛编程问题上的表现有所提升，并在科学问题基准测试中超越了人类博士水平的准确度。

布朗表示，这些模型通过一种称为“思维链”（chain-of-thought）的推理技术取得了这些成绩，该技术涉及将复杂问题分解为更小的逻辑步骤。

研究人员指出，当将这种方法用作提示技术时，AI模型在解决复杂问题时的表现往往会得到改善。

OpenAI现在已将这种能力自动化，使模型能够自主分解问题，而无需用户提示。

OpenAI表示，“我们训练这些模型在回答之前花更多时间思考问题，就像人类一样。通过训练，它们学习精炼思维过程，尝试不同的策略，并识别自己的错误”。

路透社于2023年11月首次报道了OpenAI的推理项目，当时该项目被称为Q*。2024年7月的报道中，项目已被称为草莓。

来源：

https://www.reuters.com/technolo ... roblems-2024-09-12/

By Katie Paul and Anna Tong
September 13, 20244:28 AM GMT+10Updated 2 hours ago

仰望星空：南风车星系M83
M63南风车星系，在长蛇座，直径12万光年，距离地球一千五百万光年，是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。

dootbear

版主

发表于 2024-9-13 08:00 |显示全部楼层

此文章由 dootbear 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 dootbear 所有！转贴必须注明作者、出处和本声明，并保持内容完整

本文要点：

1. OpenAI推出了“草莓”系列的新AI模型，具备更强的推理能力，可以解决复杂问题。

2. 新模型在国际数学奥林匹克竞赛资格考试中取得了83%的高分，并在科学和编程问题的表现上超过了人类博士水平。

3. 模型使用“思维链”推理技术，自动化分解复杂问题，学习优化思维过程和识别错误。

仰望星空：南风车星系M83
M63南风车星系，在长蛇座，直径12万光年，距离地球一千五百万光年，是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。

zigzag

皮靴族

发表于 2024-9-13 09:11 来自手机 |显示全部楼层

此文章由 zigzag 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 zigzag 所有！转贴必须注明作者、出处和本声明，并保持内容完整

图2看着瘆人。

fiony

铜靴族

发表于 2024-9-13 09:17 来自手机 |显示全部楼层

此文章由 fiony 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 fiony 所有！转贴必须注明作者、出处和本声明，并保持内容完整

本帖最后由 fiony 于 2024-9-13 08:21 编辑

https://community.openai.com/t/i ... trawberry/829618/16

本帖子中包含更多资源

您需要登录才可以下载或查看，没有帐号？注册

x

评分

参与人数 1	积分 +4	收起理由
yacobe	+ 4

查看全部评分

xzhang

皮靴族

发表于 2024-9-13 09:25 |显示全部楼层

此文章由 xzhang 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 xzhang 所有！转贴必须注明作者、出处和本声明，并保持内容完整

ChatGPT说这个成绩达到甚至超过顶尖选手的水平，不知真假

yuxuanlin

钻石靴族

发表于 2024-9-13 09:45 |显示全部楼层

此文章由 yuxuanlin 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 yuxuanlin 所有！转贴必须注明作者、出处和本声明，并保持内容完整

据说，到2027年，AGI就会出现

AI的智商会碾压所有人类的总和。

多么期待这一天的到来，应该是可以活着看到。

然后，期待——电影——终结者的情节，在现实中一一展现。

上书房行走

金靴族

发表于 2024-9-13 09:47 |显示全部楼层

此文章由上书房行走原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者上书房行走所有！转贴必须注明作者、出处和本声明，并保持内容完整

炒作。继续炒作。骗傻子。

zpai

银靴族

发表于 2024-9-13 10:47 |显示全部楼层

此文章由 zpai 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 zpai 所有！转贴必须注明作者、出处和本声明，并保持内容完整

不喜欢跟草莓联系起来

fhjp01

金靴族

发表于 2024-9-13 11:55 |显示全部楼层

此文章由 fhjp01 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 fhjp01 所有！转贴必须注明作者、出处和本声明，并保持内容完整

让 ChatGPT写些数学分数的题目，结果发现会得出一个可以接受的答案但是不可理解的过程。

本帖子中包含更多资源

您需要登录才可以下载或查看，没有帐号？注册

x

MerryX

皮靴族

发表于 2024-9-13 19:23 来自手机 |显示全部楼层

此文章由 MerryX 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 MerryX 所有！转贴必须注明作者、出处和本声明，并保持内容完整

让那些说AI没逻辑推理能力的人看看学傻了一样的做了无用功也是失业

对你爱不完

头像被屏蔽

禁止发言

发表于 2024-9-13 19:45 |显示全部楼层

此文章由对你爱不完原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者对你爱不完所有！转贴必须注明作者、出处和本声明，并保持内容完整

最近用Copilot，有时候答案不准确，有时候确实惊艳，一大段代码直接生成了

MerryX

皮靴族

发表于 2024-9-13 19:54 来自手机 |显示全部楼层

此文章由 MerryX 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 MerryX 所有！转贴必须注明作者、出处和本声明，并保持内容完整

本帖最后由 MerryX 于 2024-9-13 22:33 编辑

对你爱不完发表于 2024-9-13 18:45
最近用Copilot，有时候答案不准确，有时候确实惊艳，一大段代码直接生成了

AI吊打程序员

返回列表

		自动登录	找回密码
密码			注册

精华好帖回顾

[北美] OpenAI推出具有“推理”能力的新系列AI模型 [复制链接]

本帖子中包含更多资源

评分

本帖子中包含更多资源

发表回复

2012年度奖章获得者

2013年度奖章获得者