DRUGAI
今天为大家介绍的是来自温州医科大学眼健康与疾病高等研究院院长张康教授联手四川大学华西医院生物治疗国家重点实验室的杨胜勇教授团队联合发表的一篇论文。药物开发是一个复杂且耗时的过程,传统上主要依靠研发人员的经验和不断试错来完成。随着人工智能(AI)技术的发展,特别是新兴的大语言模型和生成式AI的出现,这一领域正在发生革命性的变化。将AI技术引入药物开发流程后,已经显著提升了整个过程的效率和成功率。本文将全面介绍AI在整个药物研发过程中的最新应用进展,包括疾病靶点的识别、新药发现、临床前研究、临床试验以及药物上市后的安全监测等环节。同时,作者也会分析目前面临的主要挑战,为未来AI辅助药物开发指明重要的研究方向。
药物开发是一个极其复杂的过程,平均需要投入约26亿美元的研发费用,耗时12-15年,而即便到了临床试验阶段,成功率仍低于10%。近年来,人工智能技术的突飞猛进,尤其是图像识别、自然语言处理(Natural Language Processing, NLP)和计算机视觉等领域的发展,为解决药物研发中的关键难题带来了新的希望。像ChatGPT和Gemini这样的大语言模型(Large Language Model, LLM),以及像Sora这样的生成式AI,在某些领域已经展现出超越人类的能力。
图 1
图1详细展示了AI技术在药物研发各个环节的应用价值,包括复杂生物系统分析、疾病标志物识别、药物靶点筛选、药物与靶点互作模拟、药物安全性和有效性预测,以及临床试验管理等方面。
本文综述了2019年以来AI在小分子药物开发领域的最新进展,内容涵盖了从早期靶点识别到后期合成方案设计的全过程。同时也详细探讨了AI在临床阶段的广泛应用,包括生物标志物的发现、已有药物的新用途开发、药物在体内的吸收代谢特性和安全性预测,以及临床试验的开展等关键环节。
AI驱动下的药物发现
近年来,人工智能已成为药物发现领域的一股变革性力量,彻底改变了传统方法,并在整个过程的多个阶段提高了效率。本节将探讨人工智能对药物发现的各个方面的深远影响,包括靶标识别、虚拟筛选、从头设计、ADMET(吸收、分布、代谢、排泄和毒性)预测,以及合成规划和自动合成和药物发现。通过利用先进的算法和技术,研究人员现在能够加速新的治疗药物的发现,提高预测的准确性,并减少与药物开发相关的总时间和成本。
靶标识别
在药物研发过程中,识别小分子靶点 (如蛋白质或核酸) 是一个关键环节。传统的识别方法,如蛋白质分离纯化技术和全基因组功能筛查等,虽然使用广泛,但往往耗时耗力,且成功率较低。人工智能技术的发展正在彻底改变这一领域。通过分析复杂生物网络中的海量数据,AI能够构建多层次的生物信息网络,帮助科研人员更好地理解疾病相关的分子特征和因果关系。
一个突出的成功案例是PandaOmics平台的研究。该平台通过整合多组学数据和生物网络分析,成功发现了一种新的治疗靶点——TRAF2-NCK相互作用激酶,并据此开发出了针对性的抑制剂INS018_055,为抗纤维化治疗开辟了新途径。此外,来自现实世界的各类数据,包括医疗记录、患者自述、电子病历和保险理赔信息等,为科研人员理解复杂疾病机制和发现新靶点提供了宝贵的参考信息。虽然这些数据往往格式不统一,存在质量参差不齐的问题,但最新研究表明,即使是这些不够完美的真实数据,也能帮助训练出实用的AI模型,为基因发现和药物靶点筛选提供重要支持。
虚拟筛选
虚拟筛选是一种高效识别潜在先导化合物和药物候选物的关键策略。随着化合物数据库规模的快速扩大,科研人员迫切需要更快速的筛选方法,这推动了AI技术在这一领域的快速发展。新一代AI模型不仅能预测药物分子在空间中的变化,还能直接生成复杂的原子空间结构,并计算药物分子与靶点蛋白之间的最佳结合方式。特别值得一提的是,基于AI的蛋白质结构预测工具AlphaFold2和RosettaFold展现出了令人振奋的前景,它们能够仅通过蛋白质序列信息就预测出复杂的立体结构。
在那些尚未明确治疗靶点的疾病(如某些罕见病)和整体表现性疾病(如衰老)的研究中,基于表型的虚拟筛选发挥着重要作用。这种方法不需要预先知道具体的作用靶点,而是直接寻找能产生期望治疗效果的化合物。作者团队最近的研究就运用人工智能技术成功开发出了一种新型抑制剂,这种药物在细胞和动物实验中都展现出了良好的治疗效果。
从头分子设计
从零开始设计新药(从头设计)是一项具有挑战性的工作,它的目标是创造出具有理想特性的全新化合物。如今,人工智能技术,尤其是深度学习的应用,让我们能够自动化地设计和发现符合特定要求的新型药物分子结构。
图 2
图2展示了如何运用深度学习进行药物分子设计。其中最关键的是分子生成环节,主要采用两种方法:一种是将分子结构转换成类似计算机语言的文本串进行处理;另一种是将分子看作由原子和化学键组成的网络结构来处理。第一种方法类似于让AI学习和书写分子的“化学语言”,而第二种方法则像是让AI学会“画”出分子结构图。
这两种方法各有特点:语言式的处理方法操作简单,但可能产生不符合化学规律的结果;而网络结构式的处理方法更符合分子的真实特征,但计算过程更为复杂。例如,作者团队开发的PocketFlow模型就成功预测出了能与特定蛋白质结合位点相匹配的药物分子,并通过实验证实了这些分子的药效。此外,科研人员还可以通过设定特定的分子骨架来引导AI设计出更有针对性的药物分子,不过这样可能会限制创新的可能性。
ADMET
ADMET(吸收、分布、代谢、排泄和毒性)是评估药物在人体内表现的关键指标,直接决定着药物的有效性和安全性。虽然实验室测试仍然是药物上市审批必不可少的环节,但在早期阶段运用AI技术预测药物的ADMET特性,可以大大减少因药物性质不佳而导致的研发失败。
如今,深度学习技术已经成为ADMET预测的重要工具。它能够自动分析药物分子的结构特征,预测其在人体内的表现。研究人员开发了多种AI模型,包括擅长处理序列数据的Transformer、善于识别图像特征的卷积神经网络,以及专门用于分析分子结构的图神经网络。其中,图神经网络(如GeoGNN模型)因为能够充分考虑分子的三维结构特征,在预测准确度上表现最为出色。
不过,这一领域仍面临着不少挑战。首先是数据问题:由于获取ADMET实验数据需要投入大量时间和资金,可用于训练AI模型的高质量数据相对匮乏,这可能导致AI模型“学习”不充分。为了解决这个问题,科研人员正在探索让AI模型通过“自学习”方式提升预测能力。其次是如何更好地向AI模型描述分子结构的问题。最新研究表明,将分子的多个层面特征(如化学结构、物理性质等)结合起来,能够帮助AI模型做出更准确的预测。
合成规划、自动化合成以及新药发现
化学合成是小分子药物研发中的一个重要瓶颈,这项工作不仅技术要求高,而且极其耗时费力。计算机辅助合成规划和自动化合成技术的出现,让科研人员能够从繁重的重复性工作中解放出来,投入更具创造性的研究。
图 3
图3a展示了计算机辅助合成规划的工作原理:通过“逆向思维”的方式,将复杂的目标分子逐步拆解成更简单的原料分子,就像解拼图一样,找出最合适的合成路线。图3b则展示了有机化合物自动化合成的前沿技术,这代表着化学研究领域的未来发展方向。
深度学习技术的应用使得自动化合成系统变得更加智能。科研人员开发出了一个完整的自动化药物研发流程,称为“设计-制造-测试-分析”循环。在这个过程中,AI系统首先设计潜在的药物分子结构,然后通过自动化设备合成这些分子,接着进行各项测试,最后分析测试结果并据此改进设计方案。
图 4
如图4所示,AI技术还能通过分析各类生物学数据,帮助研究人员了解新药在体内的作用机制。这包括药物如何在体内分布和代谢、产生什么样的治疗效果、是否有毒副作用,以及能被人体吸收利用的程度等关键信息。这些信息对于评估新药的安全性和有效性至关重要。
AI在临床试验与现实世界的实践
人工智能通过分析患者数据,包括遗传信息、临床病史和生活方式因素,日益指导临床试验的各个方面。将人工智能方法应用于此类数据有助于识别影响药物反应的生物标志物和患者特征,使更有效和信息更丰富的试验设计。通过优化患者选择、治疗方案和结果测量等参数,人工智能有可能提高试验的成功,并加速将候选药物转化为临床实践。现实世界的数据也提供了丰富的信息来源,人工智能应用程序可以从中预测不良事件、药物-药物相互作用和其他结果。下面的部分描述了人工智能在药物开发的临床阶段的关键应用。
生物标志物发现
生物标志物就像是人体健康状况的“信号灯”,科研人员可以通过检测这些标志物来判断身体是否健康、疾病的发展状况以及治疗效果。传统上,发现新的生物标志物主要依靠科学家提出假设然后进行验证,这个过程不仅耗时耗力,而且往往难以全面把握复杂疾病的特点。
人工智能技术的发展为生物标志物的发现开辟了新途径。比如,“nuclei.io”这个智能病理诊断系统能够通过分析细胞核的特征,为病理医生提供精确的诊断建议,大大提高了诊断的准确性和效率。在预测疾病发展趋势方面,AI也展现出了强大的能力。通过分析血液中的免疫细胞特征,AI可以预测脓毒症患者的病情发展;通过识别细胞衰老的特征,可以评估组织的健康状况;通过分析蛋白质组的变化,可以预测肝病患者的预后。这些预测对于制定个性化治疗方案具有重要指导意义。
预测药物计量学特性与药物重定位
AI技术在药物研发中的一个重要应用是帮助确定药物的最佳使用剂量,并预测药物在人体内的表现。例如,通过分析442种小分子激酶和2,145种不良反应的数据,AI成功发现了一些以前未知的药物副作用,这对开发更安全的药物具有重要指导意义。此外,AI还能通过分析患者的基因信息、生理特征和既往治疗反应,为医生提供个性化的用药建议,从而优化治疗效果。
除了开发新药,AI还在药物重定位(即发现已有药物的新用途)方面发挥着重要作用。如图4所示,科研人员开发了一个名为MitoReID的AI系统,通过分析细胞内能量工厂(线粒体)的变化来了解药物的作用机制。这个系统分析了超过57万张细胞图像,在识别FDA批准药物的作用机制方面取得了76%以上的准确率。例如,它成功验证了茶叶中的一种天然成分(表儿茶素)具有抗炎作用。
AI还能通过分析真实世界的医疗数据(如电子病历和保险理赔记录)来模拟临床试验,加速药物重定位的进程。比如,有研究团队利用AI分析了数百万冠心病患者的医疗记录,成功找出了能改善治疗效果的药物和药物组合。
提高试验效率与结果预测
临床试验是新药研发中最关键但也最具挑战性的环节,往往耗时长、成本高,而且经常面临招募志愿者困难等问题。AI技术的应用为提高临床试验的效率带来了新的希望。
图 5
如图5所示,AI可以通过分析电子病历、保险理赔数据和智能可穿戴设备收集的健康数据来评估药物的效果和安全性。例如,研究人员开发的Trial Pathfinder工具分析了超过6万名晚期肺癌患者的电子病历,发现如果适当放宽临床试验的入选标准,不仅可以让更多患者有机会参与试验,还能获得更好的治疗效果。
一项突破性的技术创新是“数字孪生”,这项技术可以为每位参与者创建一个虚拟的“数字分身”。在传统的临床试验中,研究人员需要将参与者分为两组:一组使用新药(实验组),另一组使用安慰剂或标准治疗(对照组)。而通过数字孪生技术,研究人员可以创建参与者的虚拟复制品作为对照组,这样就能让更多真实患者有机会使用新药,大大提高了试验效率。
目前,多家生物科技公司正在积极推进这项技术的应用。例如,Unlearn.ai公司获得了1200万美元的资金支持,用于开发数字孪生技术;Novadiscovery和Jinkō等公司也在肺癌等疾病领域开展基于数字孪生的临床试验模拟。此外,AI还可以用于分析药物上市后的安全性数据,帮助及早发现和解决潜在的安全隐患,这对于优化药物开发流程和推进监管科学的发展都具有重要意义。
面临挑战
尽管AI技术在药物研发领域取得了显著进展,但目前还没有任何一款完全由AI开发的药物通过临床试验的第二阶段,这凸显出药物开发的复杂性。
首要挑战是高质量数据的缺乏。获取药物研发数据不仅成本高昂,还受到隐私法规的限制,各机构之间的数据共享也不充分。这个问题在罕见疾病和新型药物靶点研究中尤为突出。此外,现有的数据常常存在信息不完整、错误和偏差等问题。特别是那些实验失败或临床试验结果不理想的“负面”数据,往往不会被发表,这使得我们难以全面理解药物、靶点和疾病之间的关系。
在药物设计方面,如何平衡多个成功要素是一大挑战。目前的研究过于关注化合物的结构特征,而忽视了药物是否容易被人体吸收利用(成药性)以及是否容易合成(可合成性)等关键因素。虽然科研人员正在开发能够同时考虑多个目标的设计方法,但要准确预测药物的活性和效果仍然十分困难。
AI技术本身也面临着算法和计算能力的限制。许多用于药物开发的AI算法最初是为其他领域设计的,可能并不完全适合药物研发的特殊需求。同时,AI技术需要强大的计算资源,这对小型研究团队来说是一个不小的负担。再加上药物开发周期长、成功率低、投资回报不确定等因素,也影响着投资者的信心。
未来方向
AI正在彻底改变药物研发的过程。通过分析复杂的生物医学数据,AI可以帮助发现新的生物标志物、治疗靶点,并加速药物的发现和重新定位。尽管如此,要充分发挥AI的潜力,还需要克服许多挑战。以下是几个重要的发展方向:
首要任务是解决数据不足的问题。一方面,需要建立更好的数据共享机制和标准;另一方面,需要开发新的AI算法,使其能够从有限的数据中获得准确的预测结果。例如,一些新型AI模型可以同时处理文字描述和化学结构信息,这对于处理数据稀缺的情况特别有帮助。目前的研究方法往往只关注单一类型的数据,这样容易忽略生物系统之间复杂的相互关系。随着计算技术的进步,特别是图形处理器(GPU)计算能力的提升,AI已经可以同时处理文本、图像和视频等多种形式的数据。这种“多模态”分析方法,能够帮助我们更全面地理解药物的作用机制。
另一个重要方向是将物理定律融入AI算法。生命系统遵循基本的物理规律,药物的作用也不例外。通过在数据驱动的AI算法中加入物理规律的约束,可以减少对大量数据的依赖,同时提高模型的准确性和通用性。
大语言模型(LLM)等AI技术还可以帮助制药企业更好地遵守监管要求,通过分析大量文档并及时跟进最新规定,提高效率并减少合规风险。同时,开发可解释的AI模型也很重要,这有助于建立药物研发者、监管机构、医生和患者之间的信任。
在未来几十年,AI在医学领域的应用将更加深入。通过创建详细的虚拟人体模型,AI可以帮助我们更好地理解疾病机制和药物作用。在临床试验方面,AI可以通过模拟不同场景来优化试验设计,加快患者招募。此外,AI还将通过分析健康数据和基因信息,为医生提供个性化的诊疗建议,并为医学教育提供更真实的虚拟训练场景。
结论
AI技术的不断进步正在大幅提升药物研发的效率,降低研发成本。然而,我们也需要清醒地认识到AI的局限性。AI最大的优势在于能够快速分析海量复杂数据,帮助科研人员做出更快更好的决策,但它并不能完全替代人类的智慧和判断。AI设计的药物分子和预测的药物特性,最终都需要在实验室中通过真实的生物学实验来验证。同时,AI研究的方向和应用范围仍需要人类来把控。
不过,随着AI技术的持续发展,特别是像AlphaFold3(一个能够准确预测蛋白质结构的AI模型)这样的大型AI模型不断开源,我们有理由对AI在加速药物研发、造福人类健康方面的前景持谨慎乐观的态度。AI就像是科研人员手中的“超级助手”,它能够帮助我们更快地发现新药、更准确地预测药物效果,但最终的决策权和创造力仍在人类手中。通过人机协作,有望开发出更多安全有效的新药,让更多患者受益。
编译|于洲
审稿|王梓旭
参考资料
Zhang, K., Yang, X., Wang, Y. et al. Artificial intelligence in drug development. Nat Med 31, 45–59 (2025).
https://doi.org/10.1038/s41591-024-03434-4