前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Nature | 贝叶斯优化算法为合成化学带来了哪些突破?

Nature | 贝叶斯优化算法为合成化学带来了哪些突破?

作者头像
智能生信
发布于 2021-03-03 07:57:02
发布于 2021-03-03 07:57:02
1.5K0
举报
文章被收录于专栏:智能生信智能生信

今天给大家介绍的是来自普林斯顿大学计算机科学教授Ryan P. Adams课题组及美国新生代比较知名的有机化学家Abigail G. Doyle课题组联合发表在Nature上的文章。在本文中,作者对贝叶斯优化在合成化学中用于反应优化进行了研究。实验表明,在日常实验室实践中,贝叶斯优化方法在筛选反应条件中可以做出更优质的决策,从而促进更有效的化学合成。

1

背景

贝叶斯优化是一种由不确定性引导的响应面法,用于优化计算上开销较大的目标函数,旨在平衡对不确定区域的探索和对可用信息的利用,从而在较少的评估中获得高质量的配置。在许多情况下已显示出其优于专家及其他全局优化算法的卓越性能。更重要的是,贝叶斯优化算法可以应用于包括任意参数化反应域的多种搜索空间,并可以并行选择多个实验,因此该方法非常适合于化学过程的优化。但目前的研究中尚未出现针对典型批处理化学的应用程序,也没有通用的软件平台供非专家使用,并且软件的性能也没有系统地与专业化学家进行比较。

作者提出了一种用于贝叶斯反应优化的新框架,并报告了目前开放源代码软件工具的开发情况,该工具可让化学家轻松地将最新的优化算法集成到他们的实验室实践中。另外作者收集了钯催化的直接芳基化反应的大型基准数据集,在反应优化中对贝叶斯优化与人为决策的比较进行了系统的研究,并将贝叶斯优化应用于两个现实优化工作中,分别为Mitsunobu和脱氧氟化反应。

2

优化器开发

2.1 基本原理

对于给定的搜索空间,贝叶斯反应优化首先从实验设计的初始反应数据或已存在的反应结果出发。利用这些数据训练出一个概率代理模型(probabilistic surrogate model),该模型由先验概率函数和先前的结果观测集共同决定产生。之后通过优化采集函数(acquisition function)以选择反应空间中最有可能的候选实验进行下一次评估。最终将评估结果加入到结果观测集中,同时更新概率代理模型。该过程反复进行,直到达到终止条件为止(反应收率最大化,资源枯竭或对空间的探索程度使得不可能找到改善的条件)。

图1 贝叶斯优化的图形概述

2.2 贝叶斯优化器的开发

作者从文献中整理了反应数据以进行优化器开发和评估。选择Suzuki-Miyaura(图2 1)和Buchwald–Hartwig反应(图2 2a-2e)的钯催化交叉偶联数据,目的是相对于数百种或数千种可能的反应条件组合优化目标产物的产率。

图2 利用训练数据用于选择贝叶斯优化器参数

作者选择使用不同的随机初始数据进行反应优化,并选择优化程序配置,以降低平均损失,结果差异及最坏情况损失。并以密度泛函理论编码的反应空间,利用可用的反应数据可以实现良好的优化性能。另外根据图2中涉及相关反应的性能最终选择高斯过程的代理模型参数并且选择并行的预期改进作为采集函数。

图3 在反应优化中平衡探索(explore)与利用(exploit)

3

实验

3.1 实验设置

这项研究中,作者选择了一个包含1,728个反应的子空间,其中包括12个配体,4个碱基,4个溶剂,3个温度和3个浓度(图4),作为一组易于实验的实验,可以用作基础事实作者以咪唑的直接芳基化反应(图4 3)为例评估其性能。为了将贝叶斯优化的性能与人类专家的性能进行基准比较,作者开发了一个游戏,该游戏将跟踪不同背景和经验水平的化学家在优化反应3时所做出的决策。图4c表示参与反应优化游戏的来自学术界和工业界的50名专业化学家和工程师的人类表现,图4b表示贝叶斯反应优化器的表现。

3.2 性能评估

人类参与者和机器学习优化器之间的第一点比较是优化过程中他们在每个步骤中观察到的原始最大产量。平均而言,人类发现的初始选择比随机选择的要好,在他们的第一批实验中发现的条件平均产率要高出15%。但是,即使进行了随机初始化,在五个批处理中的三批中,优化器的平均性能也超过了人类。值得注意的是,与人类参与者相反,贝叶斯优化在实验预算内100%的时间内实现了> 99%的良率。另外作者在优化的每个步骤中进行了t检验,零假设是平均人类和贝叶斯优化性能相同。图4e绘制了每种情况下的p值。p <0.05表示可以拒绝原假设。最终实验得出的结论是,在反应3的优化中,贝叶斯反应优化的平均表现优于人类专家。

图4 贝叶斯优化的统计验证

4

应用

作者将贝叶斯优化应用于两个反应,分别是优化Mitsunobu反应(图5 4)和脱氧氟化反应(图5 5)。表中列出了标准反应条件(行1,红色;两次重复实验的平均值)和通过贝叶斯优化确定的三个最高产量条件(行2-4单个实验)。该图描绘了累积最佳观测产量(黑色),单个实验结果(灰色)和标准反应条件下的产量(红色虚线)与实验批次的关系。

图5 贝叶斯反应优化的应用

研究结果表明五次实验中三次优化器均超过了基准结果,令人关注的是,在两个测试反应中,贝叶斯优化方法都可以识别出与标准条件有很大不同的参数设置的实验条件集。此外,优化器还提供了多种配置,这些配置在大多数维度上都各不相同,但效果相当。

参考资料

1.Shields, B.J., Stevens, J., Li, J. et al. Bayesian reaction optimization as a tool for chemical synthesis. Nature 590, 89–96 (2021). https://doi.org/10.1038/s41586-021-03213-y

2.auto-QChem:https://github.com/PrincetonUniversity/auto-qchem

3.EDBO: https://github.com/b-shields/edbo

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-02-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智能生信 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Nature | 突破优化合成反应瓶颈,机器学习提供新思路!
今天给大家介绍的是来自不列颠哥伦比亚大学Jason E. Hein教授发表在Nature官网News and Views上的文章。在本文中,作者介绍了Shields等人最近发表在Nature上关于加快各种合成反应的优化速度的可访问机器学习工具这一工作,并揭示了人为认知偏见如何影响优化。
智能生信
2021/03/03
5090
Nature | 突破优化合成反应瓶颈,机器学习提供新思路!
Nature | 有机合成的数字化
2019年7月,普林斯顿大学的Ian W. Davies学者在Nature上发表了一篇文章——有机合成的数字化。
DrugAI
2021/01/29
8170
JCIM|贝叶斯算法下的逆合成预测
今天给大家介绍的是日本统计数学研究所Zhongliang Guo等人在Journal of Chemical Information and Modeling上发表的一篇名为“Bayesian Algorithm for Retrosynthesis”的文章。目前,新兴的机器学习技术正在重新制定逆合成规划的过程。这项研究的目的是发现从特定的分子到商用化合物的合成路线,被简化为一个组合优化任务,其解空间受所有可能的可购反应物对的组合复杂性约束。作者在贝叶斯推理和计算的框架内处理这个问题。该工作包括一个深度神经网络的训练,能够对给定反应物的组合进行高精度的前向预测,然后利用贝叶斯条件概率定理将正向模型反演为逆向模型。贝叶斯逆合成算法的正向模型预测精度约为87%。作者还研究了基于专家知识的不同候选物的潜在适用性。
智能生信
2021/03/19
8850
JCIM|贝叶斯算法下的逆合成预测
Nature|利用大型语言模型开展自主化学研究
化学研究以迭代循环为基础,通过设计、执行和改进实验来实现特定目标。研究人员的经验和直觉在最初的设计和随后的优化过程中起着至关重要的作用,而这在以前的化学研究自主系统中是无法复制的。
智药邦
2024/03/05
2960
Nature|利用大型语言模型开展自主化学研究
超参数调优算法与调度器详解:网格搜索、贝叶斯、Hyperband、PBT...
超参数指的是模型参数(权重)之外的一些参数,比如深度学习模型训练时控制梯度下降速度的学习率,又比如决策树中分支的数量。超参数通常有两类:
PP鲁
2024/05/27
1K0
超参数调优算法与调度器详解:网格搜索、贝叶斯、Hyperband、PBT...
榕树集--基于贝叶斯优化的抗体设计
今天介绍一篇发表于23年的文章,Khan等人开发了名为AntBO的工具,这是一种利用组合贝叶斯优化来进行抗体设计的方法。AntBO可对各种抗原进行高效的体外设计,包括SARS-CoV,可以获得具有多样化的developability的抗体。
DrugScience
2024/03/05
1780
榕树集--基于贝叶斯优化的抗体设计
CHEM SCI|基于约束贝叶斯优化,采用变分自编码器进行自动化学设计
今天给大家介绍的是Chemical Science上的文章 " Constrained Bayesian optimization for automatic chemical design using variational autoencoders"。
智药邦
2021/09/06
7620
学界 | NeurIPS 2018 中的贝叶斯研究
AI 科技评论按:神经信息处理系统大会(NeurIPS)是人工智能领域最知名的学术会议之一,NeurIPS 2018 (https://nips.cc/Conferences/2018)已于去年 12 月 3 日至 8 日在加拿大蒙特利尔市举办。来自 Zighra.com 的首席数据科学家在参加完此次会议之后,撰写了一篇关于贝叶斯研究的参会总结,AI 科技评论编译整理如下。 此次会议支持现场直播,所有讲座的视频内容均可以在 NeurIPS 的 Facebook 主页上找到,除此之外,NeurIPS 主页上还
AI科技评论
2019/11/01
8460
J. Chem. Inf. Model. | 预测化学反应产率面临的挑战
今天为大家介绍的是来自Varvara Voinarovska团队的一篇论文。这篇论文讨论了器学习(ML)在预测化学领域的高级特性(如产率、化学合成的可行性和最佳反应条件)时面临的挑战。这些挑战来源于预测任务的高维性质以及涉及的众多关键变量,包括反应物、试剂、催化剂、温度和纯化过程等。成功开发出可靠的预测模型不仅有助于优化高通量实验,还可以提升现有的逆合成预测方法,并在该领域内的多种应用中发挥重要作用。
DrugAI
2024/02/23
5480
J. Chem. Inf. Model. | 预测化学反应产率面临的挑战
贝叶斯超参数优化原理(Python)
超参数优化在大多数机器学习流水线中已成为必不可少的一步,而贝叶斯优化则是最为广为人知的一种超参数的优化方法。
算法进阶
2023/12/13
9432
贝叶斯超参数优化原理(Python)
​独家 | 一文读懂贝叶斯优化
许多现代的机器学习算法都涉及大量的超参数。为了高效地使用这些算法,我们需要选择合适的超参数值。我们将在本文中讨论贝叶斯优化,它是一种常用于调整超参数的技术。更通俗地说,贝叶斯优化可用于任何黑盒函数的优化。
数据派THU
2020/07/02
1.8K0
​独家 | 一文读懂贝叶斯优化
Angew. Chem. Int. Ed. | 分子机器学习是合成化学的未来吗?
今天给大家介绍的是来自德国威廉姆斯明斯特大学Frank Glorius教授课题组发表在德国应用化学上的文章。本文介绍了分子机器学习在合成化学领域的机遇,提出了发展方向和应对的挑战,并且鼓励刚迈进该领域的研究人员提供更好的解决方案。
DrugAI
2021/02/02
5960
Angew. Chem. Int. Ed. | 分子机器学习是合成化学的未来吗?
​通俗科普文:贝叶斯优化与SMBO、高斯过程回归、TPE
AutoML, Bayesian Optimization (BO), Sequential Model Based Optimisation (SMBO), Gaussian Process Regression (GPR), Tree Parzen Estimator (TPE).
beyondGuo
2022/03/28
5.1K0
​通俗科普文:贝叶斯优化与SMBO、高斯过程回归、TPE
独家 | 一文读懂优化算法
一、前言 模拟退火、遗传算法、禁忌搜索、神经网络等在解决全局最优解的问题上有着独到的优点,其中共同特点就是模拟了自然过程。模拟退火思路源于物理学中固体物质的退火过程,遗传算法借鉴了自然界优胜劣汰的进化思想,禁忌搜索模拟了人类有记忆过程的智力过程,神经网络更是直接模拟了人脑。它们之间的联系也非常紧密,比如模拟退火和遗传算法为神经网络提供更优良的学习算法提供了思路。把它们有机地综合在一起,取长补短,性能将更加优良。 这几种智能算法有别于一般的按照图灵机进行精确计算的程序,尤其是人工神经网络,是对计算机模
数据派THU
2018/01/30
3.6K0
独家 | 一文读懂优化算法
DeepMind最新研究登Nature,揭示AI时代科研新范式,开拓未知领域,带来全新挑战
8月2日,谷歌团队研究人员在Nature上发表了一项研究——人工智能时代的科学发现,总结了AI在科学发现中的应用和进展。
新智元
2023/09/09
2780
DeepMind最新研究登Nature,揭示AI时代科研新范式,开拓未知领域,带来全新挑战
【深度学习实验】网络优化与正则化(七):超参数优化方法——网格搜索、随机搜索、贝叶斯优化、动态资源分配、神经架构搜索
  目前,研究人员通过大量实践总结了一些经验方法,以在神经网络的表示能力、复杂度、学习效率和泛化能力之间取得良好的平衡,从而得到良好的网络模型。本系列文章将从网络优化和网络正则化两个方面来介绍如下方法:
Qomolangma
2024/07/30
1.3K0
【深度学习实验】网络优化与正则化(七):超参数优化方法——网格搜索、随机搜索、贝叶斯优化、动态资源分配、神经架构搜索
理解贝叶斯优化
贝叶斯优化是一种黑盒优化算法,用于求解表达式未知的函数的极值问题。算法根据一组采样点处的函数值预测出任意点处函数值的概率分布,这通过高斯过程回归而实现。根据高斯过程回归的结果构造采集函数,用于衡量每一个点值得探索的程度,求解采集函数的极值从而确定下一个采样点。最后返回这组采样点的极值作为函数的极值。这种算法在机器学习中被用于AutoML算法,自动确定机器学习算法的超参数。某些NAS算法也使用了贝叶斯优化算法。
SIGAI学习与实践平台
2020/06/10
8.5K0
基因泰克团队:机器学习辅助分子生成前沿进展概述
随着药物化学领域的不断发展,机器学习(ML)技术逐渐成为加速早期药物发现的重要工具。ML利用药物化学家的经验和设计偏好,将分子生成和筛选步骤整合到一个单一架构中,显著提高了新药研发的效率。然而,由于化学空间的巨大搜索空间和不连续的优化函数,设计出让药物化学家满意的ML模型仍面临诸多挑战。
智药邦
2024/07/06
4360
基因泰克团队:机器学习辅助分子生成前沿进展概述
NeurIPS 2018 | 腾讯AI Lab详解3大热点:模型压缩、机器学习及最优化算法
AI领域顶会NeurIPS正在加拿大蒙特利尔举办。本文针对实验室关注的几个研究热点,模型压缩、自动机器学习、机器学习与最优化算法,选取23篇会议上入选的重点论文进行分析解读,与大家分享。Enjoy!
marsggbo
2019/01/24
6720
NeurIPS 2018 | 腾讯AI Lab详解3大热点:模型压缩、机器学习及最优化算法
4分钟成功复现诺奖!CMU开发GPT-4化学家,自主编码操控机器人颠覆化学研究登Nature
先是谷歌DeepMind的AI工具GNoME成功预测出200万种晶体结构,随后微软推出的MatterGen,大大加速了设计所需材料特性的速度。
新智元
2023/12/21
5280
4分钟成功复现诺奖!CMU开发GPT-4化学家,自主编码操控机器人颠覆化学研究登Nature
推荐阅读
相关推荐
Nature | 突破优化合成反应瓶颈,机器学习提供新思路!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档