谷歌旗下公司DeepMind最新研制出的人工高智能系统AlphaFold在蛋白质结构预测技术评估试验CASP(Critical Assessment of Structure Prediction)以58%的准确率获得冠军,并大幅领先第二名。
掌握国际象棋和围棋只能算是初级人工智能的目标。12月2日,谷歌旗下的人工智能公司DeepMind在第13届结构预测评估竞赛(CASP)中获得了最高荣誉。这项两年一度的竞赛旨在预测蛋白质的三维结构。
比赛的方式如下:竞争团队获得90种蛋白质的线性氨基酸序列,其3D形状已知,但尚未公布。然后,参赛团队计算这些序列的叠加方式。虽然总部位于伦敦的DeepMind之前没有参加过这次比赛,但其AlphaFold软件的平均预测结果比97%的竞争对手准确。
比赛结果有多接近?按照某个指标,差距很大。在没有其他已知信息的情况下,AlphaFold对90个蛋白质序列中的43个做出了25次最准确的预测。这远远超过了第二名,因为后者在43场测试中只赢了3场。
所以AlphaFold在比赛中获胜了吗?这个说法不完全对。CASP的首席组织者、美国Rockville市马里兰大学的计算生物学家John Moult表示,AlphaFold赢得了很多次,在最困难的43次测试中,其平均准确率比其他组高15%。
那么,结果到底怎么样呢?华盛顿大学西雅图分校的CASP组织者、参与者和计算建模专家David Baker指出:DeepMind的科学家是在其他人开创的两种算法策略的基础上开展工作的。首先,通过比较其他蛋白质的大量基因组数据,AlphaFold能够更好地解读哪些氨基酸最有可能在蛋白质叠加中彼此接近。其次,相关比较还能够帮助他们测量相邻氨基酸对之间最可能的距离以及它们与相邻氨基酸结合的角度。这两种方法在评估数据越多的时候效果越好,这使得它们更适应于机器学习算法,例如AlphaFold,能够通过处理大型数据集来解决问题。Baker说,DeepMind的科学家“非常擅长机器学习,拥有一支优秀的团队”,因为其财力比大多数学术团体雄厚。
不过,这个结果对新手来说还不错。洛杉矶马里兰大学的另一位CASP组织者和计算生物学家John Moult补充道:“给予他们信任,他们刚刚起步。”