首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

新型AI学习模式 引领智能化学革命

有机化学中的一个基本问题是预测化学反应中会形成的产物,包括希望的主产物和各种影响收率的副产物。虽然对于简单反应,可以比较明确地确定产物,但是对于许多复杂的有机反应来说,这并不是一件简单的事情,何况对于要求严格的药物合成工艺,理解每一个副产物都是必要的,哪怕只有含量只有千分之一。目前来说,实验仍然是分析反应结果的最主要的方式。这是一种费时、昂贵、需要有经验化学家指导的过程。对于设计合成特定目标分子的化学逆合成工作,实验部分是最大的短板。设计一条路线可能不需要几天时间,但是验证这条路线的工作量,随着反应步数的增大而增大,往往是以周为单位计数,这对新药工艺研发工作是沉重的负担。而且常常会出现一条路线可以打通但是收率太低而不得不重新规划路线的情况。如果可以提前预知主产物和副产物并且能够预测每种产物的转化比例,将会对现有的工作发生天翻地覆的变化。

一个反应模型的例子

(来源:arXiv)

之前最先进的解决方案基于反应模板。反应模板指定可以应用的分子子图模式和相应的图形转换。由于多个模板可以匹配一组反应物,所以另一个模型被训练以使用标准监督方法过滤候选产品。这种方法的主要缺点是覆盖范围和可扩展性。需要大量的模板来确保至少有一个模板可以重构正确的产品。目前,这些模板是由专家手工制作的,或者是用启发式算法从反应数据库中生成的。除了覆盖范围,应用模板涉及图表匹配,这使得检查大量的模板过于昂贵。因此目前的方法仅限于具有有限类型的反应的小数据集。

新AI方法概述

(来源:arXiv)

来自麻省理工学院(Massachusetts Institute of Technology,MIT)Connor W. Coley所在的研究团队,与IBM公司合作,开发了一种无模板的可以自主学习来预测有机化学反应产物的程序。这种类似谷歌的人工神经网络的新型AI系统,可以在无任何有机化学知识的基础上,经过24小时学习,提供了一套新的从没遇到过的专利反应正确率达到80.3%。研究团队表示这意味着这个AI超过了MIT之前创建的类似预测程序的纪录(6.3%)。

反应预测的一个例子

(来源:arXiv)

这种新型AI系统,不是通过反应模板生产候选产物,而是首先预测反应中心的一小组原子/键,然后通过列举组内所有可能的键配置变化生产候选产物。与基于模板的方法相比,这个框架运行速度提高了140倍,使得可以扩展到更大的反应数据库。反应中心标识符和候选排名模型都是从Weisfeiler-LehmanNetwork及其变体学习的。

这个AI系统不能让人了解化学实际发生了什么,而是类似“黑匣子”模型。程序里不包含任何反应参数,如温度或溶剂,因为这些细节往往不能转化为允许机器消化的格式。目前为止,还缺乏可以验证预测程序实际运行的测试。但是这样的结果已经足以振奋人心。试想如果能够扩大数据库,让AI学习更多的现有的化学知识,那么不远的将来,很可能带来化学届的一场革命,尤其是新药研发方面,新药研发效率很可能会因此大大加快。其应用前景不可限量。

论文链接:https://arxiv.org/abs/1709.04555

了解更多最全、最新论文快讯

登录CBG官网(www.chembeango.com

下载ChemBeanGo APP

CBG资讯∣知识就是力量

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20171212B09ERU00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券