Advertisement
Advertisement

新足迹

 找回密码
 注册
新足迹 门户 国际新闻 查看内容

Meta发布可检查其它AI模型工作的AI模型

2024-10-20 07:01| 发布者: dootbear | 查看: 489| 原文链接

路透社:Meta发布可检查其它AI模型工作的人工智能模型

路透社纽约10月18日消息,Facebook母公司Meta周五表示,其研究部门发布了一批新的AI模型,其中包括一个“自学评估器”(Self-Taught Evaluator),这可能为减少人工参与AI开发过程提供了一条途径。

此次发布是继Meta在8月的一篇论文中介绍该工具后展开的。

该论文详细描述了它如何依赖于与OpenAI最近发布的o1模型相同的“链式思维”(chain of thought)技术来对模型的回应做出可靠的判断。

该技术涉及将复杂问题分解为较小的逻辑步骤,并且在科学,编程和数学等领域的复杂问题上似乎提高了回应的准确性。

Meta的研究人员完全使用AI生成的数据来训练这个评估模型,排除了该阶段中的人为输入。

能够可靠地使用AI来评估AI,展示了一条可能的途径,即构建能够从自身错误中学习的自主AI代理。

参与该项目的两位Meta研究人员告诉路透社,许多AI领域的从业者设想这些代理将是足够智能的数字助手,能够无需人工干预就执行大量任务。

自我改进的模型可以消除当前常用的一种既昂贵又低效的过程,即通过人类反馈进行强化学习(Reinforcement Learning from Human Feedback, RLHF)。这种方法需要具备专门知识的人类注释员来准确标记数据,并验证对复杂数学和写作问题的答案是否正确。

研究人员之一的韦斯顿(Jason Weston)说道,“我们希望,随着AI越来越超越人类,它能够越来越好地检查自己的工作,从而真正比普通人更出色”。

他补充道,“自学并能够自我评估的理念对于实现这种超人级别的AI至关重要”。

其他公司,如谷歌和Anthropic,也已发布关于RLAIF(通过AI反馈进行强化学习)概念的研究。

然而,与Meta不同的是,这些公司通常不会将其模型向公众开放使用。

Meta在周五发布的其他AI工具还包括对公司图像识别模型“Segment Anything”的更新,加速大型语言模型(LLM)生成响应时间的工具,以及可用于帮助发现新型无机材料的数据集。






来源:

https://www.reuters.com/technolo ... ls-work-2024-10-18/

By Katie Paul
October 19, 20244:29 AM GMT+11Updated 2 hours ago
Advertisement
Advertisement


Advertisement
Advertisement
返回顶部