
走向未来
生物制药行业正面临一场深刻的“生产率危机”。尽管研发投入从1980年的20亿美元飙升至2023年的960亿美元,但新药上市数量并未相应增长,临床试验成功率持续下降,药物开发周期反而不断延长。将一款新药推向市场平均耗时超过十年,成本高达数十亿美元,而仅有不到8%的候选药物能最终获得批准。科学认知的深化、监管要求的日趋严格以及研发向高风险新型靶点的转移,共同推高了创新门槛。与此同时,无论是衡量综合效率的总要素生产率,还是衡量单位劳动产出的劳动生产率,在过去十数年间都呈现出下降或停滞的趋势。这种投入产出效率的失衡,正严重制约着新疗法的诞生和人类健康的福祉。
在这一背景下,人工智能(AI)不再仅仅是一个技术热词,而是被寄予厚望的破局关键。它以强大的数据处理和模式识别能力,为药物研发的全生命周期——从靶点发现、临床试验到生产制造与供应链管理——注入了前所未有的效率和精准度。AI的应用潜力在于,它能够系统性地提升研发生产率,增加药物产出,加速新疗法的交付,并促进市场竞争,最终改善公共卫生状况。值得一提的是,本文的深度分析基于ITIF最新报告,其报告全文可以从“走向未来”【https://t.zsxq.com/xpWzq】知识星球中获取,供读者深入研读。本文将在此基础上,深入剖析AI在生物制药各个环节的应用,揭示其面临的数据、算法、工作流集成等核心挑战,并探讨如何通过构建支持性的政策生态,充分释放AI在加速生物制药创新中的颠覆性力量。
药物发现是整个研发流程的起点,传统上也是最耗时、最不确定的阶段,通常需要五到六年时间。AI正在从根本上改变这一阶段的游戏规则,将时间尺度从“年”压缩至“月”,显著提升了前端创新的效率和成功率。
传统药物发现严重依赖于科学家对疾病生物学机制的理解,通过高通量筛选等实验方法在数以万计的化合物中寻找潜在的“种子”。这一过程不仅缓慢,且 scope 有限。AI通过分析海量的基因组学、蛋白质组学和临床数据,能够快速预测与特定疾病相关的潜在治疗靶点。例如,通过训练模型分析数万名肺癌患者与健康人群的基因表达数据,AI可以识别出那些在癌症患者中持续高表达、并可能作为药物靶点的关键基因。
更具革命性的是AI在蛋白质结构预测领域的突破。2021年,Google DeepMind的AlphaFold2系统解决了困扰生物学界50年的“蛋白质折叠问题”,能从氨基酸序列以前所未有的速度和精度预测蛋白质的三维结构。这一成就将蛋白质结构预测的时间从数月缩短到几分钟,其开源数据库已向全球科研人员免费提供几乎所有已知蛋白质的结构信息。精确的蛋白质结构是理解其功能和设计靶向药物的基石,AlphaFold2的出现极大地加速了基于结构的药物设计。
AI的应用不仅限于靶点识别,还贯穿于候选化合物的发现与优化。例如,AI模型ActFound通过在大型公共生物活性数据库ChEMBL上进行训练,能够高效预测化合物与其靶点的相互作用强度(即生物活性),其准确性和成本效益均优于传统计算方法。
AI在药物发现领域的价值已从理论走向实践,多家新兴生物技术公司报告了显著缩短的研发时间线。
这些案例清晰地表明,AI能够将药物发现阶段的时间缩短25%至50%,为每种药物节省数亿美元的研发成本。更重要的是,通过提高资本投资效率,AI使得更多有潜力的药物能够被更早、更快地识别出来。
AI并非要取代科学家,而是成为其强大的伙伴。Genentech公司与NVIDIA合作推出的“lab-in-the-loop”(循环实验室)AI平台,生动地诠释了这种人机协作的新范式。该平台利用Genentech高质量的内部数据训练AI算法,以设计新的候选化合物。这些由AI设计的化合物随即在“湿实验室”(wet lab)中进行合成与测试,实验产生的新数据又被反馈给AI模型,用于优化和迭代算法。
这种计算设计与实验验证之间的持续、快速循环,将原本线性的、试错成本高昂的研发过程,转变为一个高效、自我优化的闭环系统。Genentech利用该平台,仅用九个月就确定了其已有药物vixarelimab在溃疡性结肠炎这一新适应症上的治疗潜力,而传统方法可能需要数年。这证明了AI不仅能发现全新的药物,还能高效地拓展现有药物的治疗边界,实现老药新用。
目前,全球范围内利用AI进行药物发现的生物技术公司数量已超过900家,其中美国占据了超过53%的份额,处于全球领先地位。大型制药公司与AI公司的合作也日益紧密,从2017年的21起新增合作激增至2022年的66起,这标志着AI正从一个前沿探索工具,转变为生物制药行业不可或缺的核心创新引擎。
临床试验是药物开发中最昂贵、耗时最长(平均超过9年)且失败率最高的环节。AI的应用正从多个维度对这一关键阶段进行优化,旨在使其更快速、更高效、更具包容性,并最终提高成功率。
临床试验中最耗时的工作之一是寻找并招募符合条件的患者,这项工作可占据试验总时长的三分之一,且约20%的试验因无法招募到足够数量的参与者而失败。AI系统能够极大地加速这一进程。
斯坦福大学开发的AI系统Trial Pathfinder,通过分析已完成的临床试验数据,评估放宽某些非核心的入组标准(如血压阈值)对患者安全性的影响。研究发现,在不增加不良事件风险的前提下,适当调整标准可使非小细胞肺癌试验的合格患者数量翻倍。这不仅加速了招募,也让更多患者有机会获得前沿疗法。
另一个AI系统Criteria2Query则解决了临床试验方案语言复杂、难以转化为数据库查询语言的问题。研究人员可以用自然语言输入入组/排除标准,系统会自动将其转换为结构化的数据库查询指令,从而在电子健康记录(EHR)中快速筛选出匹配的患者群体。这不仅提升了效率,还有助于纳入以往常被不必要地排除在外的儿童和老年人群体,从而使试验人群更具代表性。
AI还能在试验设计阶段发挥关键作用,通过模拟和预测来提升试验的成功概率。以色列初创公司QuantHealth开发的AI平台Katina,能够模拟数十万种不同的试验方案组合(包括患者亚组、给药剂量、治疗周期、终点指标等),以找出成功可能性最大的设计。该平台在预测II期和III期临床试验结果方面的准确率分别达到了88%和83.2%,远高于目前行业平均的28.9%和57.8%。在与一家制药公司的合作中,通过优化试验设计,Katina帮助其将试验周期缩短了11个月,减少了251名受试者,最终节省了2.15亿美元的成本。
此外,伊利诺伊大学开发的HINT和SPOT算法,能够基于药物分子、靶点疾病和患者特征等历史数据,预测临床试验的成功率,并随着试验的进行实时更新预测,为研究人员提供了动态调整试验策略的决策依据。
临床试验参与者的多样性不足是一个长期存在的严重问题。根据FDA数据,2020年获批药物的临床试验参与者中,75%是白人,而黑人、西班牙裔和亚裔的比例严重偏低。这种同质化的受试人群可能导致药物在不同族裔间的疗效和安全性差异被忽视。例如,全球处方量最大的支气管扩张剂沙丁胺醇(Albuterol)对黑人儿童的疗效就明显低于白人儿童,这一差异因过往95%的肺病研究都在欧洲后裔中进行而被长期忽略。
AI正在成为解决这一问题的有力工具。通过前述的Trial Pathfinder和Criteria2Query等系统,研究机构可以更科学地设定入组标准,安全地招募更多样化的参与者。强生公司(Johnson & Johnson) 正是利用其内部的AI平台Trials360.ai来指导临床试验中心的选址和患者招募。AI算法通过分析真实世界数据,精准预测哪些地区的患者入组概率最高,从而将试验中心设在患者真正聚集的地方,而非沿用历史上的传统选址。这一数据驱动的方法,已帮助强生在其多发性骨髓瘤(MM)研究中,将黑人患者的入组比例提升至传统行业水平的两倍以上,有力地推动了健康公平。
最后,在监管审批环节,AI同样能够提升效率。AI可以从海量临床数据中实时监控异常值,自动审核数据质量,确保合规性,并根据最新的监管指南自动生成和格式化提交文件。像Medidata的Clinical Data Studio和Veeva的Vault RIM等AI平台,正在帮助制药公司自动化数据管理、风险监测和文件准备等繁琐工作,从而缩短审评周期,让药物更快地送达患者手中。
AI的影响力已经超越了研发阶段,延伸至药物的商业化生产和分发环节,旨在打造更高效、更可靠、更具韧性的药品供给体系。
在生产制造端,AI的应用主要体现在流程优化和质量控制上。预测性分析可以提前预警设备故障,安排预防性维护,从而减少生产线停机时间。AI算法还可以优化生产参数,提高资源利用率,并支持连续制造系统的发展,使药品生产更加灵活和敏捷。
Asimov公司是AI驱动生物工程领域的典范。该公司利用AI和合成生物学技术,从根本上改变了基因疗法等复杂生物制剂的设计与生产。基因疗法的关键挑战之一是确保治疗基因只在目标组织(如心脏)中表达,而在非目标组织(如肝脏)中保持“关闭”,以避免毒副作用。Asimov的AI平台能够设计出具有高度组织特异性的“启动子”(DNA序列),从而精准控制基因表达,使基因疗法更安全、更有效。其AAV Edge平台还优化了作为基因疗法载体的腺相关病毒(AAV)的生产流程,实现了更高、更快、更经济的治疗产品生产。这展示了AI在设计和制造高精度、定制化疗法方面的巨大潜力。
药品短缺是日益严峻的全球性公共卫生问题,其根源在于复杂的全球供应链易受自然灾害、运输延误和监管障碍等因素的干扰。AI为解决这一难题提供了新的工具。
美国药典(USP) 的“药品供应地图”(Medicine Supply Map)利用AI分析全球数百万个数据点,来预测潜在的供应链中断风险,从而让相关方能够及时干预,防止短缺发生。大型制药公司默克(Merck) 则部署了由Aera公司开发的AI系统,通过对供应商网络数据的实时分析和主动建议,来预测供应波动、调整生产计划和重新规划运输路线,从而显著提升了其供应链的效率和韧性。AI驱动的需求预测也能帮助企业避免库存积压或断货,实现更精细的库存管理。
总体而言,AI正在推动药物生产效率、供应链管理水平和先进疗法规模化生产能力的全面提升,为构建一个更具成本效益和抗风险能力的药品供给网络奠定基础。
尽管AI在生物制药领域的应用前景广阔,但要充分释放其潜力,必须正视并解决一系列深层次的挑战。这些挑战主要集中在数据、算法、工作流集成和监管四个方面。
AI模型的性能高度依赖于高质量、大规模的训练数据。在药物开发中,所需数据类型多样,包括临床数据(如EHR)、基因组数据、药物化学数据以及科研文献数据等。然而,获取和整合这些数据面临重重障碍。
为了应对这些挑战,隐私增强技术(PETs) 应运而生。这些技术允许在不暴露原始数据的情况下进行模型训练和数据分析。
推动PETs的研发和应用,建立如TEFCA(可信交换框架和通用协议)这样的国家级健康数据交换网络,以及通过公私合作伙伴关系(PPPs)促进竞争前研究阶段的数据共享,是打破数据壁垒的关键策略。
AI模型,特别是深度学习模型,常被诟病为“黑箱”,其决策过程不透明,这给高风险的药物开发带来了信任挑战。因此,算法验证和可解释AI(XAI) 的发展至关重要。XAI旨在让研究人员能够理解模型做出某一预测的原因,从而识别和纠正潜在错误,并促进跨学科团队(生物学家、化学家、临床医生和数据科学家)之间的有效沟通。
另一个严峻挑战是算法偏见。如果训练数据本身存在偏见,AI模型就会学习并放大这种偏见。前文提到的基因组学研究中欧洲后裔占比过高的问题,就是数据偏见的典型例子。这种偏见会导致AI模型对代表性不足的人群做出不准确的预测,可能开发出对这些人群疗效不佳甚至有害的药物。
为了缓解算法偏见,必须采取多重措施。首先是构建更多样化、更具代表性的数据集。美国国立卫生研究院(NIH)的“我们所有人(All of Us)”研究计划正致力于此,该计划旨在收集一百万美国人的健康数据,其中80%的参与者来自在生物医学研究中代表性不足的群体。这项计划为开发更公平的AI模型提供了宝贵的数据基础。其次,需要采用数据重加权、跨人群模型验证和定期审计等技术手段来检测和纠正偏见。
然而,仅仅拥有更多、更公平的数据并不能完全解决大模型的固有缺陷,如“幻觉”(Hallucination)和知识陈旧。大模型本质上是基于其训练数据的统计模式生成内容,当面临训练数据中未覆盖或复杂的生物医药问题时,便可能产生看似合理却与事实不符的答案。这在对准确性要求极高的药物研发领域是不可接受的。要从根本上提升AI的可靠性和精准度,就必须为其注入外部的、经过验证的、结构化的知识。
对此,长期专注于大模型与产业应用结合的资深人工智能专家王文广先生,在其著作灯塔书《知识增强大模型》中给出了系统性的解决方案。王文广作为浦东新区“明珠计划”菁英人才,拥有丰富的AI芯片、大模型训练及应用优化经验,他深刻洞察到,单纯扩大模型规模无法根治幻觉问题。他在书中提出的核心思想是,必须将大模型的强大生成能力与知识图谱等外部知识库的精确性、结构性和可解释性相结合。书中第八章“图模互补应用范式”详细阐述了如何利用知识图谱的确定性和全局视野来“锚定”大模型,减少其幻觉,并提升推理能力。这种范式将生物医药领域海量的、碎片化的知识(如基因-疾病关系、药物-靶点相互作用)构建成结构化的知识图谱,再通过检索增强生成(RAG)等技术,让大模型在回答问题或进行药物设计时,能够查询、引用并基于这些可靠知识进行推理,从而确保其产出的科学性和准确性。这为解决AI在生物制药应用中的“信任赤字”问题提供了清晰的技术蓝图。
AI不应被视为人类科学家的替代品,而是一种强大的辅助工具。AI擅长从海量数据中发现相关性,但无法进行因果推断——例如,它能发现某个蛋白质与疾病相关,但无法判断该蛋白质是否是致病原因。因果关系的判断仍然是人类科学家的核心价值所在,他们需要利用自己的专业知识和批判性思维,将AI提供的预测转化为安全有效的疗法。
因此,将AI无缝集成到现有的药物开发工作流中,是一个涉及组织变革、人员培训和技术适配的复杂过程。要成功驾驭这一转型,不仅需要企业内部的努力,更需要跨界的交流与持续的学习。生物制药领域的AI应用只是冰山一角,其背后的大模型技术、AI芯片的演进以及智能体的应用实践,都是决定未来成败的关键。为此,非常欢迎您加入最具价值的知识星球“走向未来” (https://t.zsxq.com/xpWzq),与行业专家和同好者一起,共同探讨生成式人工智能、大模型、AIGC、AI芯片和机器人等的产品、技术和应用实践,深入交流如何使用各种不同的人工智能大模型和智能体来为工作增效,为生活添彩。立即加入“走向未来”知识星球,让我们一起走向AGI的未来(https://t.zsxq.com/xpWzq)。
为了充分利用AI加速生物制药创新的潜力,并确保其发展负责任、可持续,一个全面的、支持性的政策框架至关重要。
这些政策的制定与落地,需要一个活跃、开放的生态系统来支撑,其中个体的学习与社群的智慧至关重要。展望未来,AI对生物制药的重塑,仅仅是其改变世界的一个缩影。如果您也对此充满热情,欢迎加入最有价值的知识星球【走向未来】!在这里,我们共同探索生成式AI、大语言模型、AIGC、智能体和AI芯片的无限可能——从技术原理到产品落地,从应用实践到未来趋势。无论是用AI和智能体为工作提效,还是为生活添彩,这里都有你想了解的答案,和一群志同道合的伙伴。在【走向未来】知识星球,你可以轻松学会调用各类大模型与智能体,了解最新的具身智能和机器人产品,解锁高效与创意并存的新方式,一起见证AI如何重塑我们的日常,一步步走近AGI的精彩未来。点击链接【https://t.zsxq.com/xpWzq】加入我们,马上启程,一起走向未来!
生物制药行业正站在一个由AI驱动的变革性十字路口。面对日益严峻的研发生产率挑战,AI为打破创新瓶颈提供了历史性的机遇。通过加速药物发现、精简临床试验、优化生产制造和强化供应链,AI有潜力显著缩短新疗法的上市时间,降低开发成本,并最终将更多拯救生命的药物带给全球患者。
然而,通往这一未来的道路并非坦途。数据、算法、工作流和监管方面的挑战需要学术界、工业界、政府和非营利组织协同努力,共同应对。通过构建一个支持数据流动、鼓励基础创新、培养未来人才并提供清晰监管预期的政策生态,我们才能最大限度地释放AI的潜力。对于身处其中的制药企业和研究机构而言,如何将宏观的政策机遇转化为具体的落地行动,则需要更具操作性的指南。
在这方面,王文广先生的《知识增强大模型》一书再次展现了其作为产业实践手册的价值。该书的第十章“知识增强大模型应用”为不同类型的机构提供了清晰的路线图。它不仅提出了一个完整的应用框架,涵盖了知识来源、知识运营和应用指南,还针对不同风险偏好的企业,分别给出了“全面推进”的进取者策略和“试点驱动”的保守者策略。书中独创的“四三二一”选型原则,更是为企业在选择技术路径和合作伙伴时提供了宝贵的决策依据。特别值得一提的是,10.5.4节专门探讨了“智慧医疗应用场景”,直接呼应了本文的主题,为生物制药领域的AI应用落地提供了具体案例和最佳实践。可以说,如果本文描绘了AI赋能生物制药的宏伟蓝图,那么这本书就是实现这一蓝图必不可少的施工图和操作手册,它将帮助决策者和技术人员将AI的潜力真正转化为推动人类健康的强大动力。这不仅将重振生物制药行业的创新活力,贡献于经济增长和全球竞争力,更重要的是,它将推动健康公平,加速我们攻克癌症、神经退行性疾病等复杂顽疾的进程,开启一个精准、高效、普惠的医疗新纪元。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。