
通过对杂环芳基类药物及生物活性分子进行计算机模拟反应以实现骨架编辑(如嘧啶杂环转换为咪唑杂环),构建了虚拟的骨架编辑杂环芳香化合物库,并通过量化编辑后骨架在数据库中的占比来评估其转换潜力。占比更低的杂环骨架表现出更高的转换潜力,有助于拓展可利用的化学空间。在该研究中,由嘧啶→咪唑、噻唑→吡咯的转换所对应的骨架占比均较低,表明这些转换方向可能具有更高的研究价值与应用前景。

通过选择性核心原子转化(骨架编辑) 修饰这类结构,能显著拓展药物发现与开发的化学空间,为药物研发中优先选择核心原子修饰方法提供了定量框架,并呼吁开发新合成方法实现这些高价值转化。

研究意义:
研究准备
研究对象
首先,作者选取FDA批准药物中高频出现的结构的11类杂环芳烃:吡啶(含喹啉、氮杂吲哚)、吡嗪、吡咯(含吲哚)、呋喃、咪唑、异噁唑、嘧啶(含喹唑啉)、噻唑、噁唑、哒嗪、吡嗪。检测上述杂化芳烃在4个具有代表性的化学数据库——Enamine、Mcule、ChEMBL和默克(Merck)专有库中的占比。
在Enamine化学数据库中,吡啶(26.24%)、吡唑(21.14%)和吡咯(8.10%)占据前三。

在Mcule化学数据库中,吡啶(40.08%)、吡唑(16.15%)和嘧啶(12.08%)占据前三。

在ChEMBL化学数据库中,吡啶(30.58%)、吡咯(13.35%)和嘧啶(12.92)占据前三。

分析流程
分析流程如下图所示:

对于结果归一化该关键步骤:
若生成产物数>原数据库中对应杂环的表征分子数:归一化到原数据库表征分子数;
若生成产物数<原数据库中对应杂环的表征分子数:归一化到起始分子数。
归一化后上限为 1.00(即 100% 表征),确保结果可比。

研究内容
前期研究
在未进行结果归一化这一关键步骤的改进前,Enamine、Mcule和ChEMBL文库中每个虚拟杂芳族到杂芳族转化的新生成产物(即之前在任何评估的数据集中都没有表征)的百分比显示,吡唑→呋喃、嘧啶→咪唑、吡咯→嘧啶这几种编辑的 “新分子率” 都接近100%。该数值表示计算生成的新产品相对于起始数据集的百分比。该指标确定了哪些转化(如果开发出来)将产生最多未表征的化合物。编辑这些杂环,更容易得到有药效的新分子。

由于Mcule和ChEMBL数据库比Enamine数据库小得多,因此,作者优先考虑Enamine数据集的分析结果,以获得相对公正的结果。对于某些转换,每个起始分子可以产生多个产物。例如,通过将C3或C5交换为氮原子,2-取代吡啶可以转化为两种不同的嘧啶,这种方式计算转化产生的未表征化合物的数量可能是一个误导性的指标。因此,引入了结果归一化关键步骤(具体见"分析流程")。

结果修正
进行结果修正后,Enamine数据库里"每种编辑的最终价值"——"归一化已知率"越低,说明改出来的产物里"见过的越少、新的越多",编辑越有用。例如,吡唑→呋喃(0.60%):100 个产物里只有 0.6 个是见过的,几乎全是新的。其他具有高度影响力的潜在转化包括噻唑→吡咯(13.71%)、噻唑→咪唑(14.00%)和噻唑→哒嗪(18.50%)转化。

单原子编辑技术
相比于多原子编辑,单原子编辑技术在实验室里更容易实现。嘧啶→咪唑(11.18%)(单碳缺失)成为进入新化学空间的主要转化,突显了继续开发以吡啶和嘧啶杂环为重点的骨架编辑方法的重要性。
通过硫与碳或硫与氮的交换,噻唑→吡咯(13.71%)或噻唑→咪唑(14.00%),也会产生低百分比的特征产物。总之,优先做嘧啶→咪唑、噻唑→吡咯这类"单原子、低已知率" 的编辑,既容易实现,又能出新品。

数据验证
1. Mcule数据库
吡唑→呋喃(0.20%)得到的产品在两个数据库中的商业化合物百分比最低。同样,其他多原子转换,如异噁唑→咪唑(0.36%)、嘧啶→吡咯(0.27%)和呋喃→咪唑(1.02%)的虚拟骨架编辑,产生的商业产品百分比较低。五元杂芳烃单原子转化异噁唑→吡咯(0.22%)等产生的商业化合物的低百分比进一步突显了对五元杂芳烃单原子点突变的新方法。以上显示,吡唑→呋喃(0.20%)、嘧啶→咪唑(0.52%)/吡咯(0.27%)是"跨数据库通用"的黄金编辑,不是某一个库的特例。

2. ChEMBL数据库
当ChEMBL数据库中,嘧啶→吡咯(0.06%)和嘧啶→咪唑(0.32%)的转化给出了类似的低百分比特征化合物,再次表明了它们的转化高价值。

3. 默克(Merck)数据库
在默克(Merck)数据库中,排名前三的杂环芳基分别为哌啶(36.15%)、吡咯(9.98%)和嘧啶(9.66%)。例如,吡唑→呋喃仅得到0.02%的现有产物。同样,嘧啶→吡唑(0.60%)和咪唑→嘧啶(0.73%)的转化也会产生低百分比的现有产物。

数据总结
首先展示了各类杂环芳基化合物中骨架编辑转换百分比最低的实例(下图A),最后列出了所有杂环芳基转换中百分比最低的前十种排序结果(下图B)。
吡唑→呋喃(0.60%)作为最低转换率之一的转换方式,表明其具有较大的拓宽化学空间的潜力。嘧啶是唯一在单原子编辑的前十个转换中出现三次的起始亚结构(下图B-右表),这突显了嘧啶的单原子骨架编辑可能会极大地扩展杂芳族化学空间的潜力。

最后,对Enamine数据库中特征产物百分比最低(即高值)的五个单原子转换(数据同上图)进行展示。

结论与展望