前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Biomni:首个通用生物医学AI智能体重新定义科学研究范式

Biomni:首个通用生物医学AI智能体重新定义科学研究范式

作者头像
DrugAI
发布于 2025-06-09 03:52:52
发布于 2025-06-09 03:52:52
5170
举报
文章被收录于专栏:DrugAIDrugAI

DRUGAI

2025年6月2日,斯坦福大学黄柯鑫、Serena Zhang、王瀚宸、屈元昊、陆荧洲等研究人员领衔的团队,联合Genentech, Arc Institute, 加州大学旧金山分校, 普林斯顿等多个顶尖研究机构发表了突破性研究论文“Biomni: A General-Purpose Biomedical AI Agent”,首次报道了通用生物医学AI智能体Biomni, 并在biomni.stanford.edu 开放免费注册和使用。这一系统能够自主完成横跨遗传学、基因组学、微生物学、药理学和临床医学等多个生物医学分支领域的复杂研究任务,标志着AI驱动科学发现迈入全新发展阶段。

DrugAI

,赞2

背景与挑战

当前,生物医学研究正面临前所未有的挑战:复杂的实验室实验、大规模数据集、众多分析工具和海量文献呈爆发式增长。传统研究流程往往碎片化且重复性强,严重制约了发现速度并阻碍创新进程,这凸显出对根本性新方法的迫切需求——一种能够有效扩展科学专业知识、简化研究工作流程并充分释放生物医学研究潜力的全新途径。

尽管人工智能技术已在软件工程、法律、材料科学和医疗保健等领域引发革命性变革,但在生物医学领域,现有方法主要依赖针对特定任务定制的专业智能体工作流程,这种局限性严重制约了其在整个生物医学领域的泛化应用能力。要实现AI智能体对广泛生物医学任务的有效处理,仍面临重大技术挑战——其中最为突出的是如何将先进推理能力与执行高度专业化生物医学操作的能力有机结合。

Biomni系统创新

为应对上述挑战,研究团队开发了Biomni——一个专门用于自动化推进跨领域生物医学研究的通用AI智能体。Biomni由两个核心组件构成:Biomni-E1(统一的生物医学软件和数据环境)和Biomni-A1(基于该环境的智能体)。

Biomni-E1:统一的生物医学软件和数据环境

为系统性构建生物医学行动空间,研究团队采用了AI驱动的构建方法。他们基于bioRxiv定义的25个学科类别,从每个类别中选取100篇最新发表的论文,然后利用行动发现LLM智能体逐篇分析这些论文,提取复现或生成相关研究所需的关键任务、工具、数据库和软件资源。

Biomni-E1环境整合了150个专业生物医学工具、105个软件包和59个数据库。这些工具均经过人类专家严格验证,特别侧重于具有复杂特性的工具,包括复杂代码实现、领域专业知识或专用AI模型。在数据库集成方面,团队将资源划分为两类:一类是通过网络API访问的大型关系数据库(如PDB、OpenTarget、ClinVar等),另一类是下载至数据湖并预处理为结构化格式的数据库。

图片
图片

Biomni-A1:通用智能体架构

Biomni-A1采用了多项核心创新技术,确保其在生物医学研究领域的有效运行。首先,系统引入基于LLM的工具选择机制,专门应对生物医学工具的复杂性和专业性挑战,能够根据用户目标动态检索定制化的资源子集。其次,考虑到生物医学任务通常需要复杂的程序逻辑,Biomni-A1采用代码作为通用行动接口,使其能够组合执行涉及循环、并行化和条件逻辑的复杂工作流程。第三,智能体运用自适应规划策略,基于生物医学知识制定初始计划,并在执行过程中持续优化改进。

图片
图片

性能评估与验证

基准测试表现卓越

研究团队在三个具有挑战性的多选基准测试中对Biomni进行了评估:人类最后考试(HLE)和LAB-Bench(包含数据库问答DbQA和序列问答SeqQA两个关键子任务)。

在HLE测试中,Biomni在涵盖14个生物医学子领域的52个问题上取得17.3%的准确率,显著超越基础LLM模型(6.0%)、编码智能体(12.8%)和文献智能体(12.2%),展现了其在陌生生物医学领域的出色泛化能力。

在LAB-Bench测试中,Biomni在DbQA任务中达到74.4%的准确率,与专家人类表现(74.7%)基本持平;在SeqQA任务中取得81.9%的准确率,显著超越了人类水平(78.8%)。

图片
图片

真实世界任务泛化能力

为评估Biomni在真实研究任务中的泛化表现,研究团队精心设计了八个横跨遗传学、基因组学、微生物学、药理学和临床医学的全新生物医学基准测试,具体包括:变异优先级排序、GWAS因果基因检测、CRISPR扰动筛选设计、罕见疾病诊断、药物重定位、单细胞RNA测序注释、微生物组疾病-分类群关联分析以及患者基因优先级排序。

在所有测试任务中,Biomni展现出显著的性能优势:相较于基础LLM模型提升402.3%,相较于编码智能体提升43.0%,相较于自身简化版本Biomni-ReAct提升20.4%,平均相对性能提升幅度令人瞩目。

图片
图片

实际应用案例展示

可穿戴传感器数据分析

在一项真实世界案例研究中,研究人员利用Biomni分析了来自30名参与者、涵盖数月时间的458个Excel文件,其中包含可穿戴传感器数据(连续葡萄糖监测CGM和体温记录)。Biomni自主生成并执行了一套10步分析流程:从葡萄糖峰值推断用餐事件,提取餐前/餐后温度窗口,进行跨个体标准化,并综合分析群体水平趋势。智能体成功识别出一致的餐后产热反应模式,发现平均温度升高2.19°C,同时观察到个体间存在显著差异,提示不同代谢表型的存在。

图片
图片

多组学骨骼发育研究

研究人员运用Biomni分析了一个新近发表的人类骨骼发育多组学数据集,该数据集包含336,162个单核RNA测序和ATAC测序数据点。系统自主规划并执行了十阶段分析管道,预测转录因子-靶基因调控链接,并基于基序富集和染色质可及性相关性筛选调节因子。Biomni不仅重现了已知的关键成骨转录因子(如RUNX2和HHIP)间的调控关系,还发现了多个此前未被报告的转录因子,包括AUTS2、ZFHX3和PBX1。

图片
图片

实验方案设计与验证

研究团队进一步评估了Biomni在实际实验设计中的表现,重点测试其在分子生物学核心任务——基因克隆方面的能力。在与基因编辑研究专家合作设计的开放式克隆基准测试中,Biomni生成的实验方案在准确性和完整性方面均达到人类专家水平。更重要的是,在实际湿实验室验证中,科学家严格按照Biomni设计的方案进行操作,成功完成基因克隆,测序结果显示序列完美匹配。

图片
图片

用户友好界面

为了让每位科学家都能享受到Biomni的强大功能,研究团队开发了直观的网络平台biomni.stanford.edu,用户只需提交自然语言查询即可获得由Biomni智能体系统全面支持的分析结果。无论是设计复杂的克隆实验、查询多组学数据库,还是从可穿戴设备数据中生成科学假设,科学家们现在都能在无需编程的情况下,轻松获得通用生物医学AI智能体的专业协助。

影响与展望

Biomni的问世标志着生物医学研究领域的重大突破,其跨多个子领域的强大泛化能力为AI智能体成为科学发现不可或缺的合作伙伴奠定了坚实基础。通过自动化执行原本需要专家知识和编程技能的复杂工作流程,Biomni让研究人员得以将更多精力投入到创新假设构建、实验设计创新以及跨学科合作之中。

在药物发现领域,Biomni能够自主进行靶点优先化、扰动筛选设计和药物重定位分析,为更高效、更经济的药物研发开辟新路径。在临床应用方面,其在基因优先化和罕见疾病诊断上的卓越表现,预示着更精准个性化的医学洞察和简化诊断流程的到来。在消费者健康领域,Biomni整合可穿戴设备数据和多组学分析的能力,为实时个性化健康监测和精准干预描绘了美好前景。

展望未来,Biomni及其后续版本有望成为AI驱动生物医学生态系统的核心基础设施,与人类专家形成无缝协作,共同挖掘健康与疾病领域的全新洞察。这种人机协作模式可能从根本上重塑生物医学研究格局——实现假设生成自动化,扩展发现管道规模,推动医学创新以前所未有的速度和规模发展。像Biomni这样的通用智能体不仅能够加速科学突破,更可能重新定义科学探索的未来范式。

参考资料

Kexin Huang*, Serena Zhang*, Hanchen Wang*, Yuanhao Qu*, Yingzhou Lu*, et al. "Biomni: A General-Purpose Biomedical AI Agent." bioRxiv, 2025. https://doi.org/10.1101/2025.05.30.656746.

斯坦福大学黄柯鑫、Serena Zhang、王瀚宸、屈元昊、陆荧洲 为本文的共同第一作者, 该论文由斯坦福大学Jure Leskovec, 丛乐,Michael Snyder以及基因泰克Aviv Regev指导。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-06-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugAI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
【Node】sequelize 使用对象的方式操作数据库
本文分享 sequelize 的项目实践经验,如果你还不了解 sequelize,可以先看文档
神仙朱
2022/04/12
8.9K0
【Node】sequelize 使用对象的方式操作数据库
分库分表—4.数据迁移系统文档一
(3)binlog消息消费记录表——etl_binlog_consume_record
东阳马生架构
2025/02/19
970
分布式事务 TCC-Transaction 源码分析 —— 事务恢复
1. 概述 本文分享 TCC 恢复。主要涉及如下二个 package 路径下的类: org.mengyun.tcctransaction.recover RecoverConfig,事务恢复配置接口
芋道源码
2018/03/27
1.3K0
分布式事务 TCC-Transaction 源码分析 —— 事务恢复
【腾讯云CDB】如何快速删除InnoDB中的大表
本文介绍了MySQL DROP TABLE操作可能存在的性能瓶颈,包括InnoDB引擎表、MyISAM引擎表、以及操作系统层面的限制。针对这些瓶颈,本文提出了相应的优化方案,包括增大InnoDB缓冲池、使用MyISAM存储引擎、以及调整操作系统相关参数。通过这些优化方案,可以有效地提升MySQL数据库的性能,减少DROP TABLE操作对数据库性能的影响。
腾讯云数据库 TencentDB
2017/12/14
4.1K1
干货 | 数据为王,携程国际火车票的Sharding-Sphere之路
随着国际火车票业务的高速发展,订单量快速增长,单数据库瓶颈层面的问题逐渐显露,常规的数据库优化已无法达到期望的效果。同时,原先的底层数据库设计,也存在一些历史遗留问题,比如存在部分无用字段、表通过自增主键关联和各个应用直连数据库等问题。
携程技术
2021/09/10
1.5K0
干货 | 数据为王,携程国际火车票的Sharding-Sphere之路
yii2使用Migrations为整个数据库表创建迁移
本教程为整个数据库表进行创建迁移,弥补以前未做的工作,且仅适合于Migrations(2.0.8)版本用户及以上。
botkenni
2019/09/02
2.1K0
基于Redis实现延时队列服务
点击上方“芋道源码”,选择“设为星标” 管她前浪,还是后浪? 能浪的浪,才是好浪! 每天 10:33 更新文章,每天掉亿点点头发... 源码精品专栏 原创 | Java 2021 超神之路,很肝~ 中文详细注释的开源项目 RPC 框架 Dubbo 源码解析 网络应用框架 Netty 源码解析 消息中间件 RocketMQ 源码解析 数据库中间件 Sharding-JDBC 和 MyCAT 源码解析 作业调度中间件 Elastic-Job 源码解析 分布式事务中间件 TCC-Transaction
芋道源码
2022/03/04
4410
一次大量删除导致 MySQL 慢查的分析
当慢查在执行的时候,大部分的都是表现在 Sending data 的状态,我们通过 profiling 去确认下慢查的时间分布:
用户1278550
2019/05/17
1.3K0
MySQL存储过程与定时删表
在工业监控里面,需要对每天的数据,进行记录,时间长了之后,MySQL数据库很容易撑爆。这时候,如果允许可以对之前的数据进行一次清除,只记录几个月内的数据。
星哥玩云
2022/08/18
1.6K0
有趣的MySQL(三):更新“丢失”问题
  趁着这几天过节,复盘了一下去年的一些历史遗留问题,其中有这样一个关于数据库的小问题让我忍不住翻出来又回味了一下,下面就让我们一起品味品味。
闲宇非鱼
2022/02/08
2K0
有趣的MySQL(三):更新“丢失”问题
Redis与MySQL的数据情感:延迟双删的秘密揭示
在现代应用程序中,MySQL 和 Redis 是两种常用的数据存储解决方案。然而,它们之间的数据不一致性问题一直是开发人员头痛的难题。Redis 延迟双删是一种有趣的技术,能够解决这一难题,本篇博客将带你深入了解如何使用它来确保 MySQL 与 Redis 数据的一致性,就像一场奇迹一样。
一只牛博
2025/05/30
890
Redis与MySQL的数据情感:延迟双删的秘密揭示
工作中遇到的一些坑(1)
好快啊,又是一周的轮回,本来打算把本周遇到的问题展开一个一个总结的,但是奈何踩的坑是在有点多,展开来根本没时间搞,索性就搞了这个类似周报的东西。希望从这一周开始,每一周都能坚持下来喽。
mythsman
2022/11/14
4211
定期删除客户数据库索引,手动制造慢查询来迫使客户加钱优化?小作坊下料就是猛
今天在逛论坛的时候,发现了一个极其逆天的帖子:该发帖人的客户购买了一个软件,发现这个软件对应的数据库会定期检测当前的索引然后进行删除。
程序员牛肉
2025/02/27
681
定期删除客户数据库索引,手动制造慢查询来迫使客户加钱优化?小作坊下料就是猛
京东618大促压测时自研中间件暴露出的问题总结,压测数值40w/s
前天618大促演练进行了全链路压测,在此之前刚好我的热key探测框架也已经上线灰度一周了,小范围上线了2500台服务器,每秒大概接收几千个key探测,每天大概2-4亿左右,因为量很小,所以框架表现稳定。借着这次压测,刚好可以检验一下热key框架在大流量时的表现。毕竟作为一个新的中间件,里面很多东西还是第一次用,免不得会出一些问题。
天涯泪小武
2020/05/14
8860
京东618大促压测时自研中间件暴露出的问题总结,压测数值40w/s
深度剖析如何实现事务消息
分布式事务一直是一个老生常谈的一个话题,在我的公众号下面下面已经写过很多篇分布式事务相关的文章了,但是依旧没有将其完全剖析。在之前的文章中我也多次提到我们可以使用消息队列来实现我们的分布式事务,但是大多都是一笔带过,很多读者都对这一块产生了很多疑问,希望读完这篇文章能让你理解如何用消息队列实现分布式事务。
用户5397975
2020/01/14
5590
深度剖析如何实现事务消息
高逼格企业级MySQL数据库备份方案,原来是这样....
很多人,这里说的是运维工程师们,一提到写某某方案,很是头疼。不是上某度一统搜索,就是同样一句话在N个群全部群发一遍:“有没有某某方案,可以共享一下的吗??求助,各位大佬们”,估计十有八九,全部石沉大海,杳无音讯。
数据和云
2019/05/29
1.6K0
万字长文揭秘37手游的自研任务调度平台
在 37 手游内部,「统一任务调度平台」用于管理常驻进程和调度定时任务,以确保它们按照预定的计划运行。
37手游后端技术团队
2023/03/23
7020
万字长文揭秘37手游的自研任务调度平台
你真的懂MySQL的事务隔离机制吗?
若想更改,可将启动参数transaction-isolation的值set成READ-COMMITTED。
JavaEdge
2021/02/22
1.1K0
你真的懂MySQL的事务隔离机制吗?
【愚公系列】《微信小程序与云开发从入门到实践》049-使用云函数
在微信小程序的开发过程中,如何高效地处理业务逻辑和实现复杂功能是每位开发者面临的挑战。云函数作为一种灵活、高效的无服务器计算解决方案,为小程序提供了强大的后台支持,使得开发者能够在云端运行代码,而无需关心服务器的管理与维护。这种架构不仅简化了开发流程,还提升了应用的可扩展性和安全性。
愚公搬代码
2025/01/28
3220
mysql定时备份任务
在生产环境上,为了避免数据的丢失,通常情况下都会定时的对数据库进行备份。而Linux的crontab指令则可以帮助我们实现对数据库定时进行备份。首先我们来简单了解crontab指令,如果你会了请跳到下一个内容mysql备份。 本文章的mysql数据库是安装在docker容器当中,以此为例进行讲解。没有安装到docker容器当中也可以参照参照。
Johnson木木
2020/06/23
2.1K0
推荐阅读
相关推荐
【Node】sequelize 使用对象的方式操作数据库
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档