基于CRISPR的基因组编辑技术虽已能高效鉴定蛋白质功能,但针对未被充分研究的蛋白质,高质量化学工具的缺乏仍是重大挑战。为此,全球生物医学界启动了“目标2035”联盟,旨在于2035年前为全人类蛋白质组提供严格表征的化学工具,包括化学探针和化学基因组化合物。该联盟汇聚了多家知名机构,如结构基因组学联盟、EUbOPEN联盟、勃林格殷格翰的opnMe等,以及多个化学探针相关的门户网站。
化学探针作为选择性强效的小分子调节剂,在各类模型中展现出巨大价值。尽管其选择性可能稍逊于某些工具,但通过比较多种具有重叠选择性的化学基因组化合物,并利用它们的多药理作用,科学家能够更精准地将蛋白质与表型联系起来,从而加速对未知蛋白质功能的探索。这一努力不仅将推动基础科学的发展,还为药物研发提供了新的靶点和策略。
近日,来自多伦多大学、德国法兰克福大学和勃林格殷格翰的研究人员在Drug Discovery Today上发表文章Chemical coverage of human biological pathways,分析了目前蛋白质、蛋白质家族和生物通路的化学覆盖范围。
人类蛋白质组的化学覆盖率
为了通过蛋白质跟踪“目标2035”的进展,我们分析了化学探针、化学基因组化合物和药物对人类蛋白质组的覆盖情况(图1a)。在构成人类蛋白质组的约20,000种人类蛋白质中,我们发现有2331种(11.7%)是化学工具和/或药物的靶标。这包括化学探针靶向的437个蛋白质(2.2%)、化学基因组化合物靶向的353个蛋白质(1.8%)和药物靶向的2112个蛋白质(10.6%)。我们观察到不同化合物类型之间有明显的重叠;例如,在化学工具靶向的627个蛋白质中,只有219个不是药物靶向的。
图1 人类蛋白质组的化学覆盖
人类生物通路的化学覆盖范围
为了系统追踪“目标2035”在人类生物通路中的研究进展,我们将化学探针与化学基因组化合物巧妙地映射至Reactome这一权威的人类通路知识库。Reactome作为一个综合性的生物信息学资源,详尽地描绘了细胞内分子间复杂的相互作用网络,包含了从基础代谢到高级神经功能的2673条精细通路。
图2 Reactome顶级途径的化学覆盖。(a)每个顶级途径的蛋白质总数和化学探针、化学基因组化合物和药物靶向的数量;(b)目标蛋白质的百分比
在我们的分析中,我们首先确定了每个通路内蛋白质的总数,并统计了被化学探针及化学基因组化合物成功靶向的蛋白质数量。通过对比,我们发现了一个引人注目的现象:仅有5个顶级通路的化学工具覆盖率超过了10%,而药物的覆盖率则达到了24%。这一显著差异提示我们,尽管化学探针和化合物在特定领域展现了潜力,但整体而言,它们在覆盖广泛生物通路方面的能力仍有待提升。
进一步分析显示,药物在神经元系统、肌肉收缩及新陈代谢等通路中的靶向蛋白比例较高,而在疾病通路中的覆盖率则相对较低。值得注意的是,化学探针在染色质组织这一顶级通路中展现出了优于药物的覆盖能力,这主要归功于它们对特定修饰酶的高效靶向。
当我们聚焦于Reactome的最底层通路,即那些未再细分的“最细粒度”通路时,发现化学探针和化学基因组化合物的目标通路分别占到了46.1%和36.6%。这一比例与它们在人类蛋白质组整体3.1%的覆盖率形成了鲜明对比,凸显了这些工具在解析具体生物过程时的高度集中性。
然而,我们也意识到,由于生物通路通常涉及多种蛋白质,且许多蛋白质参与多个通路,因此即使是高度选择性的化学工具,也难以实现理想的通路特异性。此外,Reactome数据库中尚未包含那些表征不清的蛋白质,它们可能潜藏于未被发现的通路之中。
图3 Reactome知识库中化合物和蛋白质的分布。至少一种化学探针、化学基因组化合物和药物靶向的Reactome最低水平(a)和最高水平(b)途径的数量。与反应组中发现的每种人类蛋白质相关的最低水平(c)和最高水平(d)途径的数量
尽管如此,现有的化学探针和化学基因组化合物汇编已能对超过半数的人类生物通路进行药理学靶向,为研究人类生物学的广泛细胞机制提供了强大的多功能工具包。随着蛋白质组化学覆盖范围的不断扩大,我们有望通过比较具有不同但重叠通路特异性的多种化学工具对细胞的影响,更深入地理解通路与表型之间的关联。当针对同一通路中不同节点的多种化学工具均能诱导出相同表型时,这种关联性将得到进一步强化,为精准医疗和药物研发开辟新的道路。
激酶组和GPCRome的化学覆盖率
在深入探究“目标2035”的进展时,我们特别关注了激酶和G蛋白偶联受体(GPCR)这两大类治疗靶点。由于这两类蛋白在药物研发中的重要性以及“目标2035”社区对其化学工具开发的持续投入,它们的化学覆盖率显著较高。
分析结果显示,538个人类激酶中有67.7%,以及802个人类GPCR中有20.3%至少被一个小分子化合物所靶向。尽管化学基因组化合物和药物在激酶上的靶向率明显高于化学探针,但部分药物的高覆盖率也反映了其选择性的不足。值得注意的是,仍有243个激酶未被任何化学探针、化学基因组化合物或选择性药物所靶向,这进一步支持了对所谓“黑暗激酶组”进行化学探索的必要性。
对于GPCR而言,药物比化学探针或化学基因组化合物具有更强的靶向性,但GPCR配体通常比激酶抑制剂更具选择性。在Reactome的29个顶级通路中,激酶广泛分布于28个通路,而GPCR则主要出现在14个通路中,这表明激酶在生物通路中的参与更为广泛。
特别地,大多数激酶都集中在信号转导顶级通路中,且在整个Reactome中的覆盖率普遍较高。对于GPCR,很大比例出现在感官知觉顶级通路中,这与其作为嗅觉受体的主要功能相吻合。在信号转导途径中,非嗅觉GPCR充当着关键的信号转导器,且这一途径中的GPCR与疾病具有广泛的关联性。
尽管化学探针和化学基因组化合物在信号转导GPCR上的覆盖率相对较高,但我们发现,在301个未被选择性药物靶向的信号转导GPCR中,仅有27个被化学探针或化学基因组化合物所靶向。这一发现强烈凸显了“目标2035”团体继续聚焦于这一蛋白家族,并开发更多针对性化学工具的紧迫性。通过这样做,我们有望揭示更多未知生物学机制,并发现新的治疗靶点,从而推动医学研究的进步。
结语
通过分析化学探针与化学基因组化合物对人类蛋白质组的覆盖情况,我们深刻认识到,利用化学工具全面靶向人类所有蛋白质仍是一项艰巨任务。为弥补化学工具的不足,抗体及其他生物制剂因其高度的选择性,尤其在蛋白质不具备化学可操作性时,成为了有效的补充手段。
图4 激酶和GPCR的化学覆盖范围
面对庞大的蛋白质数量,“目标2035”及化学生物学界应明确工作重点。首要任务是探索黑暗蛋白质组,以揭示新的分子机制及疾病关联。我们的分析已显示,部分化学工具已靶向到Reactome中未注释的特征不清的蛋白质,这为深入研究提供了线索。
其次,应关注大型蛋白质家族,因其生产和纯化、检测开发及结构化学研究相对成熟,有利于化学工具的开发。结合这两种策略,黑暗激酶组或黑暗GPCR组成为重点研究对象,它们与疾病的紧密联系使这一研究尤为重要。
此外,我们提出第三种策略:以互补和基于途径的方法指导“目标2035”的工作。将蛋白质映射到药物靶点丰富的通路上,可增加其作为(迄今未知)药物靶点的可能性。例如,信号转导中的GPCRs,部分已成为选择性药物靶点,而其余未被靶向的GPCRs则是潜在的药物靶点。化学探针和化合物在揭示这些潜在靶点中发挥着关键作用。
为加速这一全球努力的临床影响,我们应重点关注富含药物但缺乏化学工具的生物通路中的蛋白质。同时,不能忽视对化学探索不足的途径开发化学工具,以拓展对人类生物学的了解。
为了促进这些策略的实施,我们在apps.thesgc.org/pmp/网站上提供了一个网络工具ProbemyPathway(PmP),用户可以通过该工具浏览化学工具对人类生物学通路的覆盖范围。
参考资料:
https://doi.org/10.1016/j.drudis.2024.104144
--------- End ---------