近日,天壤XLab基于自主研发的蛋白质设计平台TRDesign,以AI为主导,从头设计了新冠刺突蛋白结合剂,可以阻止刺突蛋白和人体ACE2蛋白结合。
ACE2名为血管紧张素转换酶2,是SARS-CoV-2进入细胞所需的受体,在SARS-CoV-2入侵宿主细胞的过程中起着至关重要的作用。而新冠刺突蛋白结合剂具有和S蛋白结合的能力,从而成为SARS-CoV-2病毒的诱饵受体。通过与病毒竞争性结合,能有效防止病毒与细胞表面的天然ACE2结合,进而阻止病毒进入宿主细胞。
图:天壤新冠刺突蛋白结合剂设计流程
传统的刺突蛋白结合剂开发常采取制备抗体或改造天然ACE2的办法,然而此类方法不仅实验步骤繁杂、耗时长、效率低,终端产物更受到分子量大、成本高等问题的限制,很难广泛应用。因此国外也探索出了成本更低、技术更具挑战的设计蛋白的方式。
然而此前,从头设计具有新结构和功能的蛋白质,大部分是使用RosettaDesign的方法进行的。一种方式是通过参数改变现有结构模块(或模板)之间的相对集合形状来设计螺旋束或重复蛋白质,另外一种方式则是通过组装现有结构的肽片段来构建,终究还是要依托已知的天然蛋白质结构。
天壤此次依托自主研发的蛋白质设计平台TRDesign,不依靠任何已知的天然蛋白质结构,从头设计生成了新冠刺突蛋白结合剂,不仅具有迷你蛋白分子量小、热稳定性高且成本低的优势,且计算方法更高效、折叠空间更丰富,能有效覆盖ACE2与新冠刺突蛋白结合的整个界面以应对病毒的各类潜在突变。这在国内属于首家。
这意味着基于TRDesign的蛋白质药物设计方法,可以不再受已知天然蛋白质的功能区域制约,能更加自由机动地设计蛋白质。也意味着科学家们不再依赖传统的药物发现方法,可以主动设计治疗性蛋白质,而不是被动地寻找发现。以前无药可用的疾病,也会因设计出有效的蛋白质候选药物得以医治。
目前,TRDesign正在积极推进新冠刺突蛋白结合剂的湿实验流程,有望在近期取得新进展,这将是蛋白质治疗领域的一次重大飞跃。
天工开物,以AI为主导的蛋白质设计
作为高端生物产业的重要组成部分,合成生物学的进展备受瞩目。伴随着“21世纪是生物的世纪”这句话由调侃走向现实,人类对生命科学的探索研究,正迈进一段前所未有的时期。
能分解聚酯材料的生物酶,或许能真正解决废弃塑料的污染问题;利用大肠杆菌生产大宗化工材料,有望摆脱石油原料的束缚;打开“上帝视角”生产抗疟药物和抗癌药物,用全新的方式助力新药研发……合成生物学大量研究成果持续涌现,对各行业的影响与日俱增。
2021年,AlphaFold2预测蛋白结构的精准度超过传统方式,成为AI对基础科学领域的重大突破。自此,AI+合成生物学的组合,掀起了新一波的创新浪潮。
合成生物学是典型的多领域交叉学科,其目标是按特定需求对生物体进行设计、改造乃至重新合成,该技术突破了自然进化的限制,以此建立了一条生物制造药物、功能材料和能源替代品等的新途径。
“AI+合成生物学”有许多细分赛道,比如智能化元件工程、线路工程、代谢工程和基因组工程等。近来,由AI主导的蛋白质设计则异军突起。
主流的蛋白质开发、酶工程优化通常以天然蛋白质为基础,采用突变或定向进化的办法对其进行改造和修饰。此类方法研发耗时长、费用高,应用范畴也被局限于已知天然蛋白质的功能区域内,很难满足人们对于生物药、工业食品酶等的广泛需求。
以AI主导的蛋白质设计则致力于走出有别于传统方法的全新路径。AI通过大量学习蛋白质序列与结构的关系,能够准确探索出蛋白质可折叠空间所有潜在的可能性。挖掘具备目标功能的蛋白质序列,以从头设计的路线快速生成多肽、抗体、蛋白质。相比其它方式,AI主导的蛋白质设计平台拥有更高的设计成功率,所需的设计时间也大幅降低,从而使实现“规模化生物制造”的目标成为可能。
然而,这在过去只存在于科学家们的理想状态里。生命系统极其复杂,包含大量不同的基因和调控元件,元件之间又以海量不同的组合形成模块、网络,难以精确描述和预测。仅在人体中,就有数以万亿级的细胞相互作用并形成反馈。与之相比,获取细胞及其相互作用的过程显得十分低效,其中包括大量试验和纠错的过程,是高效设计合成生物系统的核心障碍。
“这个课题确实极具挑战,但是随着AI技术在基础科学所能发挥越来越大的作用,以及我们本身在AI和生命科学这一交叉领域的理解,一开始我们就把研发工作设置了以充分解析蛋白质功能背后蕴藏的遗传密码这一目标,大量学习了氨基酸序列与蛋白质结构之间的对应关系。我们相信这是一个有关生命本质的根本性问题,每个研究人员都得有足够的耐心才行。经过长时间的努力,我们的蛋白质设计平台TRDesign,不仅能按需从头设计自然界中不存在的蛋白质,还能够摆脱前期在实验室中大量试错。”上海天壤智能科技有限公司CEO薛贵荣说道。
上海天壤XLab团队,核心算法团队来自于帝国理工、纽约大学、上海交通大学等国内外顶尖高校,具有数十年的人工智能、生物计算、生物医药研发经验、专利和技术。
该团队融合了IT和BT技术,从分子层面对细胞微环境进行多组学分析,利用AI从头设计特异性更强、安全性更高的人工蛋白质,打破当前大分子药物开发中完全依赖于天然蛋白质改造的局限性,力求使“让所有疾病都有药可用”的愿景成为现实。
团队自主研发了快速、准确度媲美AlphaFold2的蛋白质结构预测平台TRFold,构建了具有端到端从头进行蛋白质设计、检测并进行稳定性、亲和力优化的蛋白质设计平台TRDesign,目前正全力推动特性更优异的人工蛋白质设计工艺和药物开发流程。
“从前,数以百万计的具有潜在价值的蛋白质无法通过生物制造的方式获得,现在可以通过TRDesign进行研究,并用于生物医学和化学、材料学、环境保护等众多领域。比如研发蛋白药,使用TRDesign,药物可以从真正意义上被设计出来,而不是通过传统方式发现筛选出来。”薛贵荣博士表示。
除了新冠刺突蛋白结合剂,该平台还设计了IL-2类似物,通过拟合天然IL-2与CD122、CD132的相互作用,激活记忆T细胞及自然杀伤细胞,同时避免与CD25相互作用带来的毒性和免疫抑制,以此提高药物的抗肿瘤疗效。
图:天壤从头设计的IL-2类似物能够激活特定淋巴细胞,同时避免当前IL-2类药物毒性
同时,天壤基于在强化学习和自学习领域的理解,结合实验自动化,正在设计一个智能的湿实验平台。
“以AI为主导的蛋白质设计方式与传统AIDD截然不同。我们已经基于AI构建了高效的蛋白质设计平台,后续,天壤将建立以AI为内核、数据驱动的自动化湿实验室,从而真正超越传统化学和生物学方法,以规模化的方式加快探索更具有价值的蛋白质和人类疾病的潜在疗法。我们相信AI有巨大的潜力能够站在一个更高的视野理解生命、设计生命、拓宽生命的广度。”天壤X-lab负责人苗洪江博士介绍。
开启未来的设计方式
从全球范围来看,以AI为核心的蛋白质设计已经从技术概念过渡到价值验证阶段,已经有多款以AI为主导研发的生物酶、医药蛋白进入临床试验阶段。
由生命科学顶级风投Flagship Pioneering孵化的Generate Biomedicines,基于机器学习驱动的Generative Biology平台,研究了百万量级的蛋白质,学习蛋白质功能密码,从而快速设计、生成执行目标功能的新型蛋白质疗法。并在2022年1月拿到来自Amgen的5个订单,预付款约5千万美元,潜在合约价值超19亿美元。
此外,AbCellera建立了专有的AI驱动抗体发现平台,通过分析天然免疫系统数据库来寻找可以开发为药物的抗体。
国内企业的强势入局,加速了这一领域技术壁垒的形成,为强化合成生物技术战略科技力量打下了坚实基础。而AI与合成生物学擦出的美妙火花,也促进了能源和环境可持续性、原材料采购、食品生产和人类健康等方面的改善,吸引着越来越多的企业和科研机构的加入。
随着AI技术的逐渐成熟,一个高效且低成本的蛋白质研发时代即将到来。让我们想象五年、十年、二十年后可能发生的事情,希望由AI主导设计的蛋白质能够真正点燃“创造万物”的动力引擎。
--------- End ---------