精华好帖回顾
· 行路走四方—— 爱他，就伴他走四方！ (2014-2-4) 黄老师	· 2015不一样的巴厘岛游-泡酒店和SPA之旅（全部更新完毕，海量美图） (2015-1-13) harbridge
· 一个老头（原创分享） (2015-6-11) ahyu	· 木木的面包机扎堆贴：花卷，红油汤饺，面包，凉皮都来了(106楼，水晶蒸饺出锅了） (2008-11-15) spicypig

查看: 492|回复: 7

[北美] Meta发布可检查其它AI模型工作的AI模型 [复制链接]

发表于 2024-10-20 07:01 |显示全部楼层

此文章由 dootbear 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 dootbear 所有！转贴必须注明作者、出处和本声明，并保持内容完整

本帖最后由 dootbear 于 2024-10-20 07:59 编辑

路透社：Meta发布可检查其它AI模型工作的人工智能模型

路透社纽约10月18日消息，Facebook母公司Meta周五表示，其研究部门发布了一批新的AI模型，其中包括一个“自学评估器”（Self-Taught Evaluator），这可能为减少人工参与AI开发过程提供了一条途径。

此次发布是继Meta在8月的一篇论文中介绍该工具后展开的。

该论文详细描述了它如何依赖于与OpenAI最近发布的o1模型相同的“链式思维”（chain of thought）技术来对模型的回应做出可靠的判断。

该技术涉及将复杂问题分解为较小的逻辑步骤，并且在科学，编程和数学等领域的复杂问题上似乎提高了回应的准确性。

Meta的研究人员完全使用AI生成的数据来训练这个评估模型，排除了该阶段中的人为输入。

能够可靠地使用AI来评估AI，展示了一条可能的途径，即构建能够从自身错误中学习的自主AI代理。

参与该项目的两位Meta研究人员告诉路透社，许多AI领域的从业者设想这些代理将是足够智能的数字助手，能够无需人工干预就执行大量任务。

自我改进的模型可以消除当前常用的一种既昂贵又低效的过程，即通过人类反馈进行强化学习（Reinforcement Learning from Human Feedback, RLHF）。这种方法需要具备专门知识的人类注释员来准确标记数据，并验证对复杂数学和写作问题的答案是否正确。

研究人员之一的韦斯顿（Jason Weston）说道，“我们希望，随着AI越来越超越人类，它能够越来越好地检查自己的工作，从而真正比普通人更出色”。

他补充道，“自学并能够自我评估的理念对于实现这种超人级别的AI至关重要”。

其他公司，如谷歌和Anthropic，也已发布关于RLAIF（通过AI反馈进行强化学习）概念的研究。

然而，与Meta不同的是，这些公司通常不会将其模型向公众开放使用。

Meta在周五发布的其他AI工具还包括对公司图像识别模型“Segment Anything”的更新，加速大型语言模型（LLM）生成响应时间的工具，以及可用于帮助发现新型无机材料的数据集。

来源：

https://www.reuters.com/technolo ... ls-work-2024-10-18/

By Katie Paul
October 19, 20244:29 AM GMT+11Updated 2 hours ago

人工智能

相关帖子

仰望星空：南风车星系M83
M63南风车星系，在长蛇座，直径12万光年，距离地球一千五百万光年，是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。

dootbear

版主

发表于 2024-10-20 07:03 |显示全部楼层

此文章由 dootbear 原创或转贴，不代表本站立场和观点，版权归 oursteps.com.au 和作者 dootbear 所有！转贴必须注明作者、出处和本声明，并保持内容完整

本文要点:

1. Meta发布了一款“自学评估器”，该工具旨在减少AI开发过程中的人工参与。

2. 该模型使用AI生成的数据进行训练，排除了人为干预，展示了AI自我改进的潜力。

3. 自我改进的AI模型可以替代昂贵的“通过人类反馈进行强化学习”（RLHF）过程，提高效率。

4. 谷歌和Anthropic也在研究类似技术，但Meta更公开地向公众发布了这些模型。

仰望星空：南风车星系M83
M63南风车星系，在长蛇座，直径12万光年，距离地球一千五百万光年，是南半球看到最明亮和最近的棒旋星系之一。图中还看到距离我们22亿光年的PGC 88914星系。