DeepMind使用了一个大型语言模型(LLM)来解决人类最困难的数学问题之一,这一突破可能预示着人工智能发展的新时代的来临。
这个模型被称为FunSearch,它找到了所谓的“cap set puzzle”问题的解决方案。这个几十年来一直存在的数学难题基本上涉及在画线连接点的同时,你可以在纸上放置多少个点,而且这些点之间不能形成三个点构成的直线。
如果这让你头疼,不用担心。重要的是要注意到,这个问题从未被解决过,研究人员只在小维度上找到了解决方案。
直到今日,FunSearch成功地发现了大型cap set的新构造,远远超过了已知的最佳构造。虽然LLM并没有一劳永逸地解决cap set问题(与一些新闻标题中所传言的相反),但它确实找到了科学上的新事实。
“据我们所知,这是首次使用LLM进行科学发现,也是对一个臭名昭著的科学问题的新的可验证的知识片段。”研究人员在本周发表在《自然》杂志上的论文中写道。
在之前的实验中,研究人员使用大型语言模型来解决已知解的数学问题。
FunSearch通过将一个预训练的LLM(在本例中是Google的PaLM 2的一个版本)与一个自动化的“评估器”结合起来工作。这个事实核查器可以防止虚假信息的产生。
LLM经常产生所谓的“幻觉”,基本上就是它们编造虚假信息并将其呈现为事实。这自然而然地限制了它们在进行可验证的科学发现方面的实用性。然而,伦敦实验室的研究人员声称,使用内置的事实核查器使FunSearch与众不同。
FunSearch在LLM和评估器之间进行持续的反复交互,这个过程将初始解转化为新的知识。
这个工具对科学家来说还有一个很有希望的特点,就是它输出的程序可以展示其解决方案的构造方式,而不仅仅是解决方案本身。
“我们希望这可以激发使用FunSearch的科学家们进一步的洞见,推动一个改进和发现的良性循环。”研究人员说道。
领取专属 10元无门槛券
私享最新 技术干货