2024年11月11日,DeepMind宣布,AI蛋白质预测工具AlphaFold3现已开源。这一获得诺贝尔奖的蛋白质结构建模工具的基础代码现在可供学术界下载。
AlphaFold3终于开源了。
2024年11月11日,谷歌DeepMind公司宣布,科学家们现在可以下载AlphaFold3的基础代码,并将这一人工智能工具用于非商业用途。
DeepMind公司AlphaFold团队负责人John Jumper说:“我们很高兴看到人们用它来做什么”。
与前代产品不同,AlphaFold3能够将蛋白质与其他分子协同建模。但DeepMind并没有像AlphaFold2那样公布其底层代码,而是通过网络服务器提供访问权限,限制了科学家预测的数量和类型。
最关键的是,AlphaFold3服务器阻止科学家预测蛋白质在潜在药物作用下的行为。但现在,DeepMind发布代码的决定意味着,学术科学家可以通过自己运行模型来预测这种相互作用。
DeepMind最初表示,只通过网络服务器提供AlphaFold3可以在促进研究访问和保护商业利益之间取得适当的平衡。位于伦敦的DeepMind子公司Isomorphic Labs正在将AlphaFold3应用于药物研发。
但是,DeepMind在公布AlphaFold3的同时却没有公布其代码或模型权重,这招致了科学家们的批评,他们认为此举破坏了可重复性。DeepMind迅速改弦更张,表示将在半年内提供该工具的开源版本。
现在,任何人都可以下载AlphaFold3软件代码,并将其用于非商业目的。但目前,只有具有学术背景的科学家才能根据要求获取训练权重。
可访问版本
DeepMind也有竞争对手:在过去几个月里,几家公司基于AlphaFold3发布了开源蛋白质结构预测工具。
两家中国公司--百度和字节跳动--已经推出了自己的AlphaFold3启发模型,旧金山一家名为Chai Discovery的初创公司也推出了自己的模型。
纽约哥伦比亚大学的计算生物学家Mohammed AlQuraishi说,这些模型的一个主要局限是,与AlphaFold3一样,没有一个模型被授权用于药物发现等商业应用。不过,Chai Discovery公司的联合创始人Jack Dent说,Chai Discovery的模型Chai-1可以通过网络服务器用于此类工作。
另一家公司,位于旧金山的Ligo Biosciences,已经发布了无限制版本的AlphaFold3。但它还不具备全套功能,包括为药物和蛋白质以外的分子建模的能力。
其他团队正在开发没有这些限制的AlphaFold3版本:AlQuraishi希望在今年年底前推出完全开源的模型OpenFold3。这样,制药公司就可以利用专有数据(如与不同药物结合的蛋白质结构)重新训练自己的模型版本,从而提高性能。
开放性很重要
DeepMind的人工智能科学负责人Pushmeet Kohli说,AlphaFold3已经出现了多个复制结果,这表明即使没有开源代码,该模型也是可以复制的。他补充说,在这个学术研究人员和企业研究人员都越来越多的领域,他希望今后能看到更多关于发布规范的讨论。
AlphaFold2的开源引发了其他科学家的大量创新。例如,最近一次蛋白质设计竞赛的获奖者就利用这一人工智能工具设计出了能够结合癌症靶点的新蛋白质。Jumper最近最喜欢的AlphaFold2黑客攻击来自一个团队,他们利用该工具识别了一种帮助精子附着在卵细胞上的关键蛋白质。
在分享了AlphaFold3之后,Jumper迫不及待地想看到这样的惊喜出现--即使这些惊喜并不总是有结果。他预测说:"人们会以奇怪的方式使用它,有时会失败,有时会成功"。
参考资料
https://www.nature.com/articles/d41586-024-03708-4
--------- End ---------