新足迹

 找回密码
 注册

精华好帖回顾

· 行路走四方—— 爱他,就伴他走四方! (2014-2-4) 黄老师 · 2015不一样的巴厘岛游-泡酒店和SPA之旅(全部更新完毕,海量美图) (2015-1-13) harbridge
· 一个老头 (原创分享) (2015-6-11) ahyu · 木木的面包机扎堆贴:花卷,红油汤饺,面包,凉皮都来了(106楼,水晶蒸饺出锅了) (2008-11-15) spicypig
Advertisement
Advertisement
查看: 492|回复: 7

[北美] Meta发布可检查其它AI模型工作的AI模型 [复制链接]

2012年度奖章获得者 2013年度奖章获得者

发表于 2024-10-20 07:01 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本帖最后由 dootbear 于 2024-10-20 07:59 编辑

路透社:Meta发布可检查其它AI模型工作的人工智能模型

路透社纽约10月18日消息,Facebook母公司Meta周五表示,其研究部门发布了一批新的AI模型,其中包括一个“自学评估器”(Self-Taught Evaluator),这可能为减少人工参与AI开发过程提供了一条途径。

此次发布是继Meta在8月的一篇论文中介绍该工具后展开的。

该论文详细描述了它如何依赖于与OpenAI最近发布的o1模型相同的“链式思维”(chain of thought)技术来对模型的回应做出可靠的判断。

该技术涉及将复杂问题分解为较小的逻辑步骤,并且在科学,编程和数学等领域的复杂问题上似乎提高了回应的准确性。

Meta的研究人员完全使用AI生成的数据来训练这个评估模型,排除了该阶段中的人为输入。

能够可靠地使用AI来评估AI,展示了一条可能的途径,即构建能够从自身错误中学习的自主AI代理。

参与该项目的两位Meta研究人员告诉路透社,许多AI领域的从业者设想这些代理将是足够智能的数字助手,能够无需人工干预就执行大量任务。

自我改进的模型可以消除当前常用的一种既昂贵又低效的过程,即通过人类反馈进行强化学习(Reinforcement Learning from Human Feedback, RLHF)。这种方法需要具备专门知识的人类注释员来准确标记数据,并验证对复杂数学和写作问题的答案是否正确。

研究人员之一的韦斯顿(Jason Weston)说道,“我们希望,随着AI越来越超越人类,它能够越来越好地检查自己的工作,从而真正比普通人更出色”。

他补充道,“自学并能够自我评估的理念对于实现这种超人级别的AI至关重要”。

其他公司,如谷歌和Anthropic,也已发布关于RLAIF(通过AI反馈进行强化学习)概念的研究。

然而,与Meta不同的是,这些公司通常不会将其模型向公众开放使用。

Meta在周五发布的其他AI工具还包括对公司图像识别模型“Segment Anything”的更新,加速大型语言模型(LLM)生成响应时间的工具,以及可用于帮助发现新型无机材料的数据集。






来源:

https://www.reuters.com/technolo ... ls-work-2024-10-18/

By Katie Paul
October 19, 20244:29 AM GMT+11Updated 2 hours ago
仰望星空:南风车星系M83
M63南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。
Advertisement
Advertisement

2012年度奖章获得者 2013年度奖章获得者

发表于 2024-10-20 07:03 |显示全部楼层
此文章由 dootbear 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 dootbear 所有!转贴必须注明作者、出处和本声明,并保持内容完整
本文要点:  

1. Meta发布了一款“自学评估器”,该工具旨在减少AI开发过程中的人工参与。
  
2. 该模型使用AI生成的数据进行训练,排除了人为干预,展示了AI自我改进的潜力。
  
3. 自我改进的AI模型可以替代昂贵的“通过人类反馈进行强化学习”(RLHF)过程,提高效率。  

4. 谷歌和Anthropic也在研究类似技术,但Meta更公开地向公众发布了这些模型。  
仰望星空:南风车星系M83
M63南风车星系,在长蛇座,直径12万光年,距离地球一千五百万光年,是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。

发表于 2024-10-20 07:48 来自手机 |显示全部楼层
此文章由 yxfc2003 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 yxfc2003 所有!转贴必须注明作者、出处和本声明,并保持内容完整
人类更焦虑了

发表于 2024-10-20 11:24 |显示全部楼层
此文章由 tuxiaobao 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 tuxiaobao 所有!转贴必须注明作者、出处和本声明,并保持内容完整
自循环,AI自己产生数据,基于自己产生数据建立模型,基于自己产生数据建立的模型和其应用产生数据发展检查验证模型,周而复始。。。。。。

发表于 2024-10-20 11:29 来自手机 |显示全部楼层
此文章由 achilles 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 achilles 所有!转贴必须注明作者、出处和本声明,并保持内容完整
行了,牛马和leader都有了,可以自己干了。

发表于 2024-10-20 22:15 来自手机 |显示全部楼层
此文章由 李十三 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 李十三 所有!转贴必须注明作者、出处和本声明,并保持内容完整
AI 检查 AI, AI 修改 AI, AI 设计 AI。机器人设计生产机器人。不需人类介入
Advertisement
Advertisement

发表于 2024-10-20 22:28 来自手机 |显示全部楼层
此文章由 水月境天 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 水月境天 所有!转贴必须注明作者、出处和本声明,并保持内容完整
是的。早晚他们自己设计世界

发表于 2024-10-20 22:37 |显示全部楼层
此文章由 laoqiu 原创或转贴,不代表本站立场和观点,版权归 oursteps.com.au 和作者 laoqiu 所有!转贴必须注明作者、出处和本声明,并保持内容完整
学生用AI做作业
老师用AI检查学生用AI做作业
学生用老师的AI检查不出来的AI做作业

发表回复

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Advertisement
Advertisement
返回顶部