前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Nature | 贝叶斯优化算法为合成化学带来了哪些突破?

Nature | 贝叶斯优化算法为合成化学带来了哪些突破?

作者头像
智能生信
发布2021-03-03 15:57:02
发布2021-03-03 15:57:02
1.5K0
举报
文章被收录于专栏:智能生信智能生信

今天给大家介绍的是来自普林斯顿大学计算机科学教授Ryan P. Adams课题组及美国新生代比较知名的有机化学家Abigail G. Doyle课题组联合发表在Nature上的文章。在本文中,作者对贝叶斯优化在合成化学中用于反应优化进行了研究。实验表明,在日常实验室实践中,贝叶斯优化方法在筛选反应条件中可以做出更优质的决策,从而促进更有效的化学合成。

1

背景

贝叶斯优化是一种由不确定性引导的响应面法,用于优化计算上开销较大的目标函数,旨在平衡对不确定区域的探索和对可用信息的利用,从而在较少的评估中获得高质量的配置。在许多情况下已显示出其优于专家及其他全局优化算法的卓越性能。更重要的是,贝叶斯优化算法可以应用于包括任意参数化反应域的多种搜索空间,并可以并行选择多个实验,因此该方法非常适合于化学过程的优化。但目前的研究中尚未出现针对典型批处理化学的应用程序,也没有通用的软件平台供非专家使用,并且软件的性能也没有系统地与专业化学家进行比较。

作者提出了一种用于贝叶斯反应优化的新框架,并报告了目前开放源代码软件工具的开发情况,该工具可让化学家轻松地将最新的优化算法集成到他们的实验室实践中。另外作者收集了钯催化的直接芳基化反应的大型基准数据集,在反应优化中对贝叶斯优化与人为决策的比较进行了系统的研究,并将贝叶斯优化应用于两个现实优化工作中,分别为Mitsunobu和脱氧氟化反应。

2

优化器开发

2.1 基本原理

对于给定的搜索空间,贝叶斯反应优化首先从实验设计的初始反应数据或已存在的反应结果出发。利用这些数据训练出一个概率代理模型(probabilistic surrogate model),该模型由先验概率函数和先前的结果观测集共同决定产生。之后通过优化采集函数(acquisition function)以选择反应空间中最有可能的候选实验进行下一次评估。最终将评估结果加入到结果观测集中,同时更新概率代理模型。该过程反复进行,直到达到终止条件为止(反应收率最大化,资源枯竭或对空间的探索程度使得不可能找到改善的条件)。

图1 贝叶斯优化的图形概述

2.2 贝叶斯优化器的开发

作者从文献中整理了反应数据以进行优化器开发和评估。选择Suzuki-Miyaura(图2 1)和Buchwald–Hartwig反应(图2 2a-2e)的钯催化交叉偶联数据,目的是相对于数百种或数千种可能的反应条件组合优化目标产物的产率。

图2 利用训练数据用于选择贝叶斯优化器参数

作者选择使用不同的随机初始数据进行反应优化,并选择优化程序配置,以降低平均损失,结果差异及最坏情况损失。并以密度泛函理论编码的反应空间,利用可用的反应数据可以实现良好的优化性能。另外根据图2中涉及相关反应的性能最终选择高斯过程的代理模型参数并且选择并行的预期改进作为采集函数。

图3 在反应优化中平衡探索(explore)与利用(exploit)

3

实验

3.1 实验设置

这项研究中,作者选择了一个包含1,728个反应的子空间,其中包括12个配体,4个碱基,4个溶剂,3个温度和3个浓度(图4),作为一组易于实验的实验,可以用作基础事实作者以咪唑的直接芳基化反应(图4 3)为例评估其性能。为了将贝叶斯优化的性能与人类专家的性能进行基准比较,作者开发了一个游戏,该游戏将跟踪不同背景和经验水平的化学家在优化反应3时所做出的决策。图4c表示参与反应优化游戏的来自学术界和工业界的50名专业化学家和工程师的人类表现,图4b表示贝叶斯反应优化器的表现。

3.2 性能评估

人类参与者和机器学习优化器之间的第一点比较是优化过程中他们在每个步骤中观察到的原始最大产量。平均而言,人类发现的初始选择比随机选择的要好,在他们的第一批实验中发现的条件平均产率要高出15%。但是,即使进行了随机初始化,在五个批处理中的三批中,优化器的平均性能也超过了人类。值得注意的是,与人类参与者相反,贝叶斯优化在实验预算内100%的时间内实现了> 99%的良率。另外作者在优化的每个步骤中进行了t检验,零假设是平均人类和贝叶斯优化性能相同。图4e绘制了每种情况下的p值。p <0.05表示可以拒绝原假设。最终实验得出的结论是,在反应3的优化中,贝叶斯反应优化的平均表现优于人类专家。

图4 贝叶斯优化的统计验证

4

应用

作者将贝叶斯优化应用于两个反应,分别是优化Mitsunobu反应(图5 4)和脱氧氟化反应(图5 5)。表中列出了标准反应条件(行1,红色;两次重复实验的平均值)和通过贝叶斯优化确定的三个最高产量条件(行2-4单个实验)。该图描绘了累积最佳观测产量(黑色),单个实验结果(灰色)和标准反应条件下的产量(红色虚线)与实验批次的关系。

图5 贝叶斯反应优化的应用

研究结果表明五次实验中三次优化器均超过了基准结果,令人关注的是,在两个测试反应中,贝叶斯优化方法都可以识别出与标准条件有很大不同的参数设置的实验条件集。此外,优化器还提供了多种配置,这些配置在大多数维度上都各不相同,但效果相当。

参考资料

1.Shields, B.J., Stevens, J., Li, J. et al. Bayesian reaction optimization as a tool for chemical synthesis. Nature 590, 89–96 (2021). https://doi.org/10.1038/s41586-021-03213-y

2.auto-QChem:https://github.com/PrincetonUniversity/auto-qchem

3.EDBO: https://github.com/b-shields/edbo

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-02-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智能生信 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档