Meta发布可检查其它AI模型工作的AI模型

2024-10-20 07:01| 发布者: dootbear | 查看: 489| 原文链接

路透社：Meta发布可检查其它AI模型工作的人工智能模型

路透社纽约10月18日消息，Facebook母公司Meta周五表示，其研究部门发布了一批新的AI模型，其中包括一个“自学评估器”（Self-Taught Evaluator），这可能为减少人工参与AI开发过程提供了一条途径。

此次发布是继Meta在8月的一篇论文中介绍该工具后展开的。

该论文详细描述了它如何依赖于与OpenAI最近发布的o1模型相同的“链式思维”（chain of thought）技术来对模型的回应做出可靠的判断。

该技术涉及将复杂问题分解为较小的逻辑步骤，并且在科学，编程和数学等领域的复杂问题上似乎提高了回应的准确性。

Meta的研究人员完全使用AI生成的数据来训练这个评估模型，排除了该阶段中的人为输入。

能够可靠地使用AI来评估AI，展示了一条可能的途径，即构建能够从自身错误中学习的自主AI代理。

参与该项目的两位Meta研究人员告诉路透社，许多AI领域的从业者设想这些代理将是足够智能的数字助手，能够无需人工干预就执行大量任务。

自我改进的模型可以消除当前常用的一种既昂贵又低效的过程，即通过人类反馈进行强化学习（Reinforcement Learning from Human Feedback, RLHF）。这种方法需要具备专门知识的人类注释员来准确标记数据，并验证对复杂数学和写作问题的答案是否正确。

研究人员之一的韦斯顿（Jason Weston）说道，“我们希望，随着AI越来越超越人类，它能够越来越好地检查自己的工作，从而真正比普通人更出色”。

他补充道，“自学并能够自我评估的理念对于实现这种超人级别的AI至关重要”。

其他公司，如谷歌和Anthropic，也已发布关于RLAIF（通过AI反馈进行强化学习）概念的研究。

然而，与Meta不同的是，这些公司通常不会将其模型向公众开放使用。

Meta在周五发布的其他AI工具还包括对公司图像识别模型“Segment Anything”的更新，加速大型语言模型（LLM）生成响应时间的工具，以及可用于帮助发现新型无机材料的数据集。

来源：

https://www.reuters.com/technolo ... ls-work-2024-10-18/

By Katie Paul
October 19, 20244:29 AM GMT+11Updated 2 hours ago

		自动登录	找回密码
密码			注册