近日,Meta研究团队推出了一系列创新的AI模型,其中引人注目的是一款名为「自我训练评估器」的工具。该工具旨在降低AI开发对人类干预的依赖,运用类似于OpenAI新发布的o1模型中的「思维链」技术,使AI能够自主、可靠地评估自身模型的输出。
据透露,Meta的研究人员利用完全由AI生成的数据来训练这一评估器,实现了在整个训练过程中不依赖人类参与的目标。这一突破性的尝试,展现了实现自主AI智能体的巨大潜力,这些智能体具备从自身错误中学习的能力。
两位负责该项目的Meta研究人员表示,众多AI专家对未来开发出高度智能化的数字助手充满期待,这些助手将能够自主完成大量任务,无需人类干预。
与此同时,除了Meta之外,谷歌和Anthropic等公司也在探索基于人工智能反馈的强化学习概念,但这些公司通常不会将他们的模型公开发布。
此外,Meta还发布了其他多项AI工具,包括更新了图像识别模型Segment Anything,该模型能够显著提升大型语言模型(LLM)的响应速度,以及一个用于协助发现新无机材料的数据集。
领取专属 10元无门槛券
私享最新 技术干货