新足迹

 找回密码
 注册

精华好帖回顾

· 面子产品大交流之乱七八糟版 (2007-3-12) joaquin · 80年代经典电视译制片之三 (2008-11-4) zmzhu
· 登陆两年间 (2005-5-28) leeshine · 我的海运经验分享 (2007-3-6) suel
Advertisement
Advertisement
查看: 1055|回复: 13

[NSW] 排列组合题目。。。四个ai全答复错了? [复制链接]

发表于 2024-4-28 16:58 |显示全部楼层
此文章由 呼呼呼 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 呼呼呼 所有!转贴必须注明作者、出处和本声明,并保持内容完整
total 8 people attend 4 swimming competitions. in each competition, positions have the following points:  first has 20 points, second has 15 points, third has 12 points, forth has 9 points, fifth has 6 points, sixth has 4 points, seventh has 3 points, eighth has 2 points.  Each of people may achieve an award if has total 40 points. What is the maximum number of people who can achieve an award?

问了四个ai  每个ai 答复的结果不同(有两个算法一样的,但是结果不同)。并且没一个是正确答案。
抠脚大叔
Advertisement
Advertisement

发表于 2024-4-28 17:07 来自手机 |显示全部楼层
此文章由 innsfree 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 innsfree 所有!转贴必须注明作者、出处和本声明,并保持内容完整
正常的,LLM的数学能力有限。
解答数学问题适合用GPT+Wolfram Alpha,插件商店里有。
GPT负责分析题目,Wolfram Alpha负责解题。

发表于 2024-4-28 17:36 来自手机 |显示全部楼层
此文章由 innsfree 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 innsfree 所有!转贴必须注明作者、出处和本声明,并保持内容完整
GPT商店里有。

发表于 2024-4-28 18:24 |显示全部楼层
此文章由 呼呼呼 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 呼呼呼 所有!转贴必须注明作者、出处和本声明,并保持内容完整

试了。还是错误答案。并且过程感觉没逻辑。

您自己试试。
抠脚大叔

发表于 2024-4-28 18:53 |显示全部楼层
此文章由 terry11 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 terry11 所有!转贴必须注明作者、出处和本声明,并保持内容完整
数学AI都是给的错的

发表于 2024-4-28 21:19 来自手机 |显示全部楼层
此文章由 ovlesser 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 ovlesser 所有!转贴必须注明作者、出处和本声明,并保持内容完整
正常,目前所有生成式AI都是基于大语言模型,所有的训练和目标只是能理解自然语言和以自然语言给出回复。至于说的对不对不是目前AI关心的事情
Advertisement
Advertisement

发表于 2024-4-29 01:36 来自手机 |显示全部楼层
此文章由 innsfree 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 innsfree 所有!转贴必须注明作者、出处和本声明,并保持内容完整
我试过了,可以得到6。不过要念四段AI咒语才能引导出来。一段咒语就会得到8提示需要复杂运算,给出一段python代码让本地运算。

发表于 2024-4-29 15:18 |显示全部楼层
此文章由 呼呼呼 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 呼呼呼 所有!转贴必须注明作者、出处和本声明,并保持内容完整
innsfree 发表于 2024-4-29 01:36
我试过了,可以得到6。不过要念四段AI咒语才能引导出来。一段咒语就会得到8提示需要复杂运算,给出一段pyth ...

求教您录入的咒语  :)
抠脚大叔

2019年度勋章

发表于 2024-4-29 15:44 |显示全部楼层
此文章由 superdigua 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 superdigua 所有!转贴必须注明作者、出处和本声明,并保持内容完整
GPT-4:  7

perplexity.ai: 4

copilot: 8

gemini: 4

claude.ai: 8

2019年度勋章

发表于 2024-4-29 15:45 |显示全部楼层
此文章由 superdigua 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 superdigua 所有!转贴必须注明作者、出处和本声明,并保持内容完整
需要等 GPT-5

估计

发表于 2024-4-29 16:04 |显示全部楼层
此文章由 samon 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 samon 所有!转贴必须注明作者、出处和本声明,并保持内容完整
数学老师看来目前还能安全个几年
Advertisement
Advertisement

发表于 2024-5-1 18:15 来自手机 |显示全部楼层
此文章由 innsfree 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 innsfree 所有!转贴必须注明作者、出处和本声明,并保持内容完整
呼呼呼 发表于 2024-4-29 15:18
求教您录入的咒语  :)

不好意思,没法复制出来了。企业版的copilot有数据保护,禁用了历史功能。

咒语思路是这样的:
咒语一:4/8 combinations from the array with the sum 40+,得到17个组合
咒语二:total point and averages,得出理论最大值7,以及统计分布的要求。
咒语三:证明理论最大值7的统计分布不存在。
咒语四:证明6的分布存在,并给出一个解。

发表于 2024-5-1 19:04 来自手机 |显示全部楼层
此文章由 act_nan 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 act_nan 所有!转贴必须注明作者、出处和本声明,并保持内容完整
每场比赛71分,4场一共284分。
最差的也有8分,剩下的最多6人达到40分。
目测6人应该够分264分

发表于 2024-5-1 22:10 |显示全部楼层
此文章由 xiaohuangniu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 xiaohuangniu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
Reasoning 的题目我也试过让ChatGPT做, 正确率60%左右. 感觉如果ChatGPT裸考Selective 估计也不能进James Ruse.

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部