路透社:Meta发布可检查其它AI模型工作的人工智能模型 路透社纽约10月18日消息,Facebook母公司Meta周五表示,其研究部门发布了一批新的AI模型,其中包括一个“自学评估器”(Self-Taught Evaluator),这可能为减少人工参与AI开发过程提供了一条途径。 此次发布是继Meta在8月的一篇论文中介绍该工具后展开的。 该论文详细描述了它如何依赖于与OpenAI最近发布的o1模型相同的“链式思维”(chain of thought)技术来对模型的回应做出可靠的判断。 该技术涉及将复杂问题分解为较小的逻辑步骤,并且在科学,编程和数学等领域的复杂问题上似乎提高了回应的准确性。 Meta的研究人员完全使用AI生成的数据来训练这个评估模型,排除了该阶段中的人为输入。 能够可靠地使用AI来评估AI,展示了一条可能的途径,即构建能够从自身错误中学习的自主AI代理。 参与该项目的两位Meta研究人员告诉路透社,许多AI领域的从业者设想这些代理将是足够智能的数字助手,能够无需人工干预就执行大量任务。 自我改进的模型可以消除当前常用的一种既昂贵又低效的过程,即通过人类反馈进行强化学习(Reinforcement Learning from Human Feedback, RLHF)。这种方法需要具备专门知识的人类注释员来准确标记数据,并验证对复杂数学和写作问题的答案是否正确。 研究人员之一的韦斯顿(Jason Weston)说道,“我们希望,随着AI越来越超越人类,它能够越来越好地检查自己的工作,从而真正比普通人更出色”。 他补充道,“自学并能够自我评估的理念对于实现这种超人级别的AI至关重要”。 其他公司,如谷歌和Anthropic,也已发布关于RLAIF(通过AI反馈进行强化学习)概念的研究。 然而,与Meta不同的是,这些公司通常不会将其模型向公众开放使用。 Meta在周五发布的其他AI工具还包括对公司图像识别模型“Segment Anything”的更新,加速大型语言模型(LLM)生成响应时间的工具,以及可用于帮助发现新型无机材料的数据集。 来源: https://www.reuters.com/technolo ... ls-work-2024-10-18/ By Katie Paul October 19, 20244:29 AM GMT+11Updated 2 hours ago |