首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Milvus 赋能 AI 药物研发

Milvus 赋能 AI 药物研发

作者头像
Zilliz RDS
发布于 2020-05-24 02:15:23
发布于 2020-05-24 02:15:23
1.1K00
代码可运行
举报
运行总次数:0
代码可运行

新药研发领域长期以来都以耗时长、成本高、风险大、回报率低而著称,一款新药的平均研发成本已经高达 26 亿美元,而平均耗时需要十年。尽管付出了如此高昂的研发成本和漫长的研发周期,却依然无法保证所研发的药物能够顺利通过全部临床实验而投放市场。即便是难度较低的仿制药研发,其研发的进程也是十分缓慢。

伴随深度学习等一系列 AI 技术的不断发展,将 AI 技术与药物研发相结合,可以很大程度上减少新药研发时间、降低新药研发成本,也可以加速仿制药的研发和入市,毫无疑问人工智能机器学习将开创一个更快速、更低价、更高效的药物研发时代。

Zilliz 公司联手全球顶尖制药研发企业共同开发了 MolSearch 化合物分子结构分析软件,为 AI 药物研发探索出了一个新的技术突破点。

| Milvus 向量搜索引擎

Milvus 作为一款开源的特征向量相似度搜索引擎,凭借其强大的非结构化数据处理能力已经广泛应用于 AI 技术的重点领域如:机器视觉(图片视频处理)、自然语言处理语音识别等。

随着 AI 技术与药物研发领域的深度结合,Milvus 在这一领域也有着广阔的应用前景。 比如新药研发过程药物晶型预测可以结合 Milvus 在图像识别的应用,有效的预测出合适的药物晶型;靶点筛选和患者招募过程可以抽象为对文本语义分析问题,可以结合 Milvus 在自然语言处理的应用,快速分析有关药物研发的文本数据等。

虚拟药物筛选是新药研发过程中的一个关键步骤,通过模拟药物筛选的过程,预测化合物可能的活性,对比较有可能成为药物的化合物进行针对性的实体筛选,极大的降低了药物研发的成本。这过程在传统的方案受限于算法和算力,在对千万级别的化合物分子进行相似性、子结构、超结构等分析时,耗时在分钟级别,而集成了 Milvus 的方案能够对十亿级的化学式数据进行秒级分析,这一技术突破能够极大的提升新药研发的效率。

Milvus 能够广泛的应用在药物研发的各个阶段,通过将成熟的 AI 模型结合 Milvus 向量搜索引擎,一定会为药物研发领域带来更多颠覆性的技术突破。

| MolSearch 虚拟药物筛选工具

MolSearch 是基于 Milvus 向量相似度检索引擎研发的一款开源化合物分析软件,前端设计参考了开源软件 MolView[1],具体搭建和功能介绍可以参考 https://github.com/zilliztech/MolSearch

药物化学专家通常根据骨架跃迁对分子模块进行优化,在此基础上设计出新药结构供后续筛选。我们共同研发 MolSearch 的初衷,是为了加速对海量化合物的虚拟筛选。虚拟筛选是新药研发中必不可少也是十分重要的一步,它的结果很大程度决定了后期小白鼠实验以及临床试验能否成功,虚拟筛选时化合物底库数量越多,筛选的准确率越高,那么新药研发成功的可能性也就越高。

MolSearch 系统中分子检索功能通过集成 Milvus 作为核心检索引擎,实现了十亿级的化学分子结构进行秒级分析的能力,这也是 MolSearch 在药物研发领域的一个重要技术突破。目前在 MolSearch 中集成了8.2亿 zinc 开放化学式分子式数据集[2],通过将化学式转换为 2048 位的化学指纹(特征向量)在 Milvus 中进行高性能向量计算而实现对分子结构的相似性、子结构和超结构检索,其端到端的检索性能如下:

表中的 p 表示百分比,响应时间(p99)表示99%的检索能在多少时间完成。

| 系统概览

MolSearch 系统中运用的虚拟化合物筛选技术,首先通过 RDKit 工具[3]将化合物分子的化学式转换为化学式指纹 (Chemical Fingerprint),就是一组特征向量,然后通过计算这些向量之间的距离来分析化合物分子之间的相似性。

1. 化学指纹生成

化学指纹通常用来做结构检索和相似度检索,如下图所示,指纹是 (1/0) 位表示的有序列表,每一位代表化学结构中例如指定元素,分子片段等的存在。

MolSearch 系统中利用 RDKit 工具生成 RDKit fingerprint,该算法分析从一个原子开始直至到达指定数量键的路径(path,通常为线性)上所有的分子片段,然后对每一个路径进行哈希(hash)产生指纹(fingerprint),如下图中展示了从NH2(已圈出)开始一直到 6 个长度的所有路径,然后将每个路径散列为二进制位。

上图仅展示了从一个单个起始原子出发的片段和比特位,对于完整的指纹,将对分子中的每个原子进行重复该过程。此类指纹适用于任意一个分子,并可以指定 fpSize 调整其向量维度,最终生成的 vectors 可以导入 Milvus 并检索。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
fromrdkitimportChem
mols=Chem.MolFromSmiles(smiles)
fp=Chem.RDKFingerprint(mols,fpSize=VECTOR_DIMENSION)
bit_fp=DataStructs.BitVectToFPSText(fp)
vectors=bytes.fromhex(hex_fp)

2. 化合物检索

通过将生成的向量导入 Milvus 建立化合物库,根据不同的计算方式可以实现对化合物的相似度检索、子结构检索和超结构检索。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from milvus import *
milvus = Milvus()
milvus.insert(collection_name=MILVUS_TABLE, records=vectors)
milvus.search(collection_name=MILVUS_TABLE, query_records=query_list, top_k=topk, params={}
  • 相似度检索

用于寻找与输入的参考分子比较相似的分子。

  • 子结构检索

检测一个分子结构是否为另一个分子的子结构。

  • 超结构检索

检测一个分子结构是否为另一个分子的超结构。

3. 化学指纹计算

Milvus 支持各种常用的相似度计算指标,包括欧氏距离、内积、汉明距离和杰卡德距离等。针对二值型数据 MolSearch 系统选择 Jaccard/Substructure/Superstructure 距离计算相似度。

根据以上参数,化学式指纹计算可以描述为:(完整公式请到留言区点击CSDN链接)

| 总结

Milvus 凭借其先进的软、硬件算法,能够为各类 AI 应用提供企业级的稳定、高性能向量检索支持。MolSearch 系统正式充分发挥了 Milvus 这一特性,实现了对海量分子式的高性能分析能力,颠覆了传统的虚拟药物筛选方案,实现了技术突破。我们相信 Milvus 必将会在药物研发的其他各个领域获得更广阔的应用前景,期待与 AI 药物研发领域的有志同仁携手共建 Milvus 这一 AI 数据处理平台。

| 引用

  1. http://molview.org/
  2. Sterling and Irwin, J. Chem. Inf. Model, 2015, https://pubs.acs.org/doi/abs/10.1021/acs.jcim.5b00559
  3. Landrum, G. 2010. “RDKit.” Q2. https://www.rdkit.org/
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-05-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 ZILLIZ 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
AI医疗高精尖!基于AI的新药研发!⛵
人工智能作为一种新兴技术,是新药研发实现降本增效的重要方式之一,『人工智能+新药研发』成为国内外医药企业加速创新转型的重要驱动力,一个更快、更便宜、更有效的新药物研发时代已经到来。
ShowMeAI
2022/11/15
7560
AI医疗高精尖!基于AI的新药研发!⛵
RDKit | 通过评估合成难度筛选化合物
无论如何获得先导化合物,评估候选先导化合物的合成难度都很重要。无论该化合物在计算机上的应用前景如何,实际上并未对其进行合成和评估。
DrugOne
2021/02/01
1.5K0
《AI+化学与制药》论坛:有AI就不搬砖,化学逆合成也可以借鉴AlphaGo的思想
2020年6月29日,未来论坛·青创联线上学术研讨会YOSIA Webinar举办第三期论坛,主题为《AI+化学与制药,人工智能为药物研发和化学研究按下快进键》。本期AI+化学与制药主题研讨会将汇集化学、制药行业代表及人工智能专家学者,一同探讨化学与制药行业的价值、研究路径及未来发展方向。
AI科技评论
2020/08/17
1K0
《AI+化学与制药》论坛:有AI就不搬砖,化学逆合成也可以借鉴AlphaGo的思想
徐峻|人工智能与药物设计学:新范式探索 (4)
随着信息技术的不断发展,药物设计方法学的新概念、新方法和新思路持续更新,药物发现范式也与时俱进。人工智能作为新工具,已应用于药物发现过程的多个方面,引起了制药行业的高度关注,也带来了对药物发现科学理论和方法学的新思考和新探索。
智药邦
2022/04/13
5490
徐峻|人工智能与药物设计学:新范式探索 (4)
Nat. Med. | AI赋能药物研发:从靶标发现到临床试验的全流程革新
今天为大家介绍的是来自温州医科大学眼健康与疾病高等研究院院长张康教授联手四川大学华西医院生物治疗国家重点实验室的杨胜勇教授团队联合发表的一篇论文。药物开发是一个复杂且耗时的过程,传统上主要依靠研发人员的经验和不断试错来完成。随着人工智能(AI)技术的发展,特别是新兴的大语言模型和生成式AI的出现,这一领域正在发生革命性的变化。将AI技术引入药物开发流程后,已经显著提升了整个过程的效率和成功率。本文将全面介绍AI在整个药物研发过程中的最新应用进展,包括疾病靶点的识别、新药发现、临床前研究、临床试验以及药物上市后的安全监测等环节。同时,作者也会分析目前面临的主要挑战,为未来AI辅助药物开发指明重要的研究方向。
DrugOne
2025/02/27
4170
Nat. Med. | AI赋能药物研发:从靶标发现到临床试验的全流程革新
云计算提速人工智能辅助药物发现,药物研发全面步入“AI时代”
2020年底,DeepMind旗下人工智能(AI)系统AlphaFold在蛋白质分子结构预测领域取得了史无前例的进步。这不仅有力推动了生命科学领域的发展,也愈发印证了具备掌握 “暗知识” 能力的AI能够助力人们直接跳过在 “未知” 暗箱中摸索的过程,而直接抵达 “新知” 的彼岸。
智药邦
2022/11/16
5630
2021人工智能药物研发创新论坛|专家精彩集锦
近30位AI药物研发相关领域的专家,分享了他们的见解和最新工作进展,从多个角度,展示了AI技术为药物研发带来的新的可能性。此次论坛干货满满!
智药邦
2021/10/26
1K0
2021人工智能药物研发创新论坛|专家精彩集锦
“伟哥之父”穆拉德通过AI药物挖掘,居然发现...
原本当时是研究心血管疾病,但男性受试者看到美女护士意外有反应,因此转研究男性勃起功能障碍。 “伟哥之父”穆拉德在一次座谈会上讲述其药物开发过程时,这样讲道。这番话让在场的观众惊讶得合不拢嘴,但这确实是药物发现的一个主要方式:偶然发现。 药物发现、生物标志物筛选等环节均是一种苦苦寻觅的过程,要在自然界无数种物质中找到一种能治疗某种特定疾病的物质。大多数情况下,科学家是无限扩大筛选对象以期邂逅目标分子,人们通常利用高通量筛选)进行筛选,HTS成本十分昂贵,它由机器人自动完成,通过在同一时间进行数以百万计的试验,
BestSDK
2018/02/28
1.3K0
量子计算如何颠覆药物研发?
在制药领域,新药的研发往往需要耗费十年以上时间,并投入数十亿美元。而在这个过程中,分子模拟、蛋白质折叠预测、化合物筛选等环节对计算能力的要求极高。随着量子计算(Quantum Computing)的崛起,这一切可能迎来革命性变化。量子计算凭借其强大的并行计算能力,为药物研发提供了全新的视角。
Echo_Wish
2025/02/23
2920
量子计算如何颠覆药物研发?
临床前药物研发,AI搞出来的已经占一半了? | 对撞派 · 圆桌实录
量子位智库 发自 凹非寺 量子位 | 公众号 QbitAI 有一条著名的双十定律,是新药研发的心头痛:平均每一款新药都需要耗费超过十年和十亿美元才能研发成功,研发效率相当低下。 现在,AI制药为新药研发创造了一种新可能。 英矽智能,被CB Insights列为2022年最有前景的100家人工智能公司之一,也是AI制药领域的明星公司。 过去12个月,英矽智能在人工智能平台的驱动下,发现了7款临床前候选药物,包括首款由AI设计的治疗新冠的临床前候选药物,以及两款合成致死策略下的潜在治疗癌症的候选药物,其进展最快
量子位
2022/06/02
2570
临床前药物研发,AI搞出来的已经占一半了? | 对撞派 · 圆桌实录
JCIM|药物发现的超大型化合物数据集概述
2022年4月14日,美国国家癌症研究所 (NCI) 计算机辅助药物设计研究课题组的Wendy等人在JCIM杂志上发表综述,整理了当前用于药物研发的超大型数据库以及检索技术的情况。
智药邦
2022/06/08
1.4K0
JCIM|药物发现的超大型化合物数据集概述
Drug Discov Today|化学分子指纹的概念和应用
分子指纹(Molecular fingerprints)可以低计算成本的方式表示大规模化学数据集中化合物的化学(结构、物理化学等)性质。它们在将化学数据集中的分子转换为适合于计算方法的一致输入格式(bit向量或数值)方面发挥着重要作用。在这篇综述中,作者将常见和最先进的分子指纹归纳并分类为8种不同类型(基于字典的、圆形的(circular)、拓扑的、药效团的(pharmacophore)、蛋白质-配体相互作用的、基于形状的、强化的和多种的)。作者还强调了分子指纹在早期药物研发中的应用。因此,本综述为药物研发使用合适的化合物(或配体-蛋白质复合物)指纹的选择提供了指南。
智药邦
2023/02/14
3.2K0
Drug Discov Today|化学分子指纹的概念和应用
AI助力新药研发 腾讯发布「云深智药」平台
在上海举办世界人工智能大会前夕,腾讯公布了进入药物研发领域的两项最新进展。在应用侧,腾讯发布首个AI驱动的药物发现平台「云深智药(iDrug)」,整合腾讯 AI Lab和腾讯云在前沿算法、优化数据库以及计算资源上的优势,提供覆盖临床前新药发现流程的五大模块,包括蛋白质结构预测、虚拟筛选、分子设计/优化、ADMET性质预测(即将开源)及合成路线规划。目前平台上已经运行十个左右研发项目,包括对抗新冠病毒药物的虚拟筛选和性质预测(正在对筛选结果进行实验验证)。 官网体验地址: https://drug.
腾讯技术工程官方号
2020/07/09
2.4K0
RDKit:化合物骨架分析
新药研发是一项耗时长且耗资巨大的工程,据资料显示由安全性问题与药物代谢动力学性质不良引起新化学实体成药失败的比例高达60%,且这一比例还在逐年升高。代谢稳定性是影响药代动力学性质的主要因素之一,它一般用来描述化合物代谢的速度和程度,也是决定药物小分子生物利用度的一个重要因素。骨架修饰是改变代谢途径、提高代谢稳定性的重要化学结构改造策略之一,通过骨架修饰进行先导化合物优化,能够显著提高先导化合物的代谢稳定性。
DrugOne
2021/02/01
1.8K0
JCIM|深度学习用于血液毒性预测和血液毒性化合物的结构分析
2022年12月6日,中南大学湘雅药学院曹东升教授团队和浙江大学药学院侯廷军教授团队合作在Journal of Chemical Information and Modeling期刊上发表论文“Structural Analysis and Prediction of Hematotoxicity Using Deep Learning Approaches”。
智药邦
2023/02/28
1.5K0
JCIM|深度学习用于血液毒性预测和血液毒性化合物的结构分析
ACS Med Chem Lett|现代药物研发中的计算应用和工具汇总
2022年6月1日,来自美国艾伯维的研究人员在ACS Med Chem Lett上发表综述文章Contemporary Computational Applications and Tools in Drug Discovery,详细统计了当前在药物设计领域被广泛使用的计算机应用和工具,并且根据工具的属性进行了细致的分门别类。
智药邦
2022/11/16
7440
ACS Med Chem Lett|现代药物研发中的计算应用和工具汇总
BioRxiv|盘古药物模型:像人类一样学习分子
2022年4月,华为健康智能实验室的乔楠及上海药物所的蒋华良、郑明月等人在BioRxiv发表文章,介绍了一个名为PanGu Drug Model的用于多个药物发现任务的新的深度学习架构。
智药邦
2022/11/16
1.1K0
BioRxiv|盘古药物模型:像人类一样学习分子
《我不是药神》与AI研制新药
最近电影《我不是药神》引发热议,原研药贵,且研制过程九死一生。近期Science Advances上发表了《Deep reinforcement learning for de novo drug design》(基于深度强化学习的新药设计)、以及2017年Journal of Cheminformatics上的《Molecular de-novo design through deep reinforcement learning》。掀起来人工智能方法研制新药的序幕,人工智能到底如何研制新药的?这种方法有什么优缺点?
用户1594945
2019/07/31
8410
《我不是药神》与AI研制新药
当AI开始寻找抗生素:人类终于摘取“高悬的果实”?
抗生素带给人类的福泽,无论给出多少溢美之词都不过分。抗生素在应用初期,被人们认为是几乎“包治百病”的灵丹妙药,成为20世纪人类最伟大的成就之一。
脑极体
2020/03/10
4360
浙江工业大学智能制药研究院段宏亮教授:AI制药的现状、技术与挑战
近年来兴起的人工智能(AI)技术,在社会生产生活的很多行业已经开花结果。作为第四次工业革命的核心技术,AI在制药行业中的应用和探索也不断加深加快。AI制药的学术、产业、投资等方面都有了新突破和新进展,这在过去的2020年尤为明显。
智药邦
2021/06/07
1.1K0
浙江工业大学智能制药研究院段宏亮教授:AI制药的现状、技术与挑战
推荐阅读
相关推荐
AI医疗高精尖!基于AI的新药研发!⛵
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档