首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >AI+Drug 文献速递 | Pycytominer为图像分析提供了标准化工具,助力药物发现和基础生物学研究

AI+Drug 文献速递 | Pycytominer为图像分析提供了标准化工具,助力药物发现和基础生物学研究

作者头像
MindDance
发布2026-01-08 11:21:21
发布2026-01-08 11:21:21
840
举报

1. Reproducible image-based profiling with Pycytominer

期刊:Nature Methods

链接:https://doi.org/10.1038/s41592-025-02611-8

简介:本文介绍了Pycytominer,一个用于图像分析下游生物信息学处理的开源Python工具,其创新点在于提供了用户友好的模块化接口,支持大规模图像数据的处理和特征提取。方法上,Pycytominer通过聚合、注释、归一化和特征选择等核心功能,处理单细胞和批量图像数据,并集成了多种数据处理库。实验中,作者使用Pycytominer重新处理了公开的细胞损伤数据集(IDR0133),并训练了一个多类逻辑回归模型,成功预测了15种细胞损伤类型,模型在训练集、测试集和独立保留数据上均表现出色。总结来说,Pycytominer为图像分析提供了标准化工具,助力药物发现和基础生物学研究。

2. RefineScore: Improving Ligand Docking Accuracy and Interpretability by Predicting MDN Corrective Physical Interactions

期刊:ChemRxiv

链接:https://doi.org/10.26434/chemrxiv-2025-kbhfb-v2

简介:本文提出了一种名为RefineScore的新型混合统计-物理评分函数,通过混合密度网络(MDN)预测范德华力和氢键原子对的距离似然,并结合神经网络参数化的物理能量方程,显著提高了蛋白质-配体相互作用的评分准确性和可解释性。该方法利用MDN重新定义了物理能量函数,并通过图表示、门控图注意力和交互网络生成最终节点图,进而计算四种评分项。实验在CASF-2016、DEKOIS2.0和DUD-E数据集上进行评估,结果显示RefineScore在评分、排名、对接和筛选任务中均表现出色,特别是在CASF-2016基准测试中达到了最先进的评分和排名能力。RefineScore的成功展示了将传统力场与几何深度学习相结合的优势,为计算机辅助药物设计提供了新的工具。

3. Generating Free-energy Landscapes and Mapping Conformational Transition Pathways from cryo-EM Images using a Deep Isometric Autoencoder

期刊:ChemRxiv

链接:https://doi.org/10.26434/chemrxiv-2024-8t70s-v2

简介:本文提出了一种基于深度学习的PaStEL与cryoTWIN方法,用于从冷冻电镜(cryo-EM)图像中生成自由能景观并绘制构象转变路径,创新点在于通过等距自编码器构建构象空间的潜在分布模型,从而揭示大分子动态行为。该方法通过训练cryoTWIN模型生成等距潜在空间,并利用PaStEL算法计算自由能景观上的最优构象转变路径。实验使用Chignolin和Trp-cage合成蛋白质的模拟数据验证了方法的有效性,并在50S核糖体(EMPIAR-10076)和SARS-CoV-2刺突蛋白(EMPIAR-10469和EMPIAR-10725)的实验数据中成功揭示了核糖体组装路径和刺突蛋白D614G突变体的热力学机制。该方法为研究大分子动态行为提供了新的工具,推动了结构生物学的发展。

4. iKraph: a comprehensive, high-quality biomedical knowledge graph for AI-powered, data-driven biomedical research

期刊:bioRxiv

链接:https://doi.org/10.1101/2023.10.13.562216

简介:本文提出了一种基于大规模生物医学知识图谱(iKraph)的自动化知识发现方法,创新性地整合了PubMed摘要和40个公共数据库的关系数据,构建了迄今为止最全面的生物医学知识图谱,并设计了可解释的概率语义推理(PSR)算法进行间接因果关系的推断。方法上,作者利用在LitCoin NLP挑战赛中获胜的信息提取管道处理了超过3400万篇PubMed摘要,结合公共数据库和高通量基因组学数据,构建了包含1068万实体和3075万关系的知识图谱。实验结果表明,该方法在COVID-19药物重定位中成功识别了600-1400个候选药物,其中三分之一在后续临床试验或文献中得到验证,展示了其在药物重定位中的高效性和准确性。总结而言,iKraph为生物医学研究提供了强大的知识发现工具,显著提升了自动化知识发现的效率和可靠性。

5. A foundation language model to decipher diverse regulation of RNAs

期刊:bioRxiv

链接:https://doi.org/10.1101/2024.10.12.617732

简介:本文提出了一种基于Transformer的RNA基础语言模型LAMAR,用于解码RNA的多层次调控机制,其创新点在于通过大规模无监督预训练和任务特定微调,实现了对RNA剪接、翻译效率和降解率等多种调控任务的全面分析。方法上,LAMAR首先在225种哺乳动物和1569种病毒的约1500万条RNA序列上进行预训练,随后使用标记数据集进行微调,以解决不同的下游任务。实验中,LAMAR在预测mRNA翻译效率和半衰期方面优于现有方法,并在预测pre-mRNA剪接位点和内部核糖体进入位点(IRES)方面表现出色,使用的数据集包括RefSeq、RNACentral和多个实验验证数据集。总结而言,LAMAR为RNA调控的全面分析提供了新的工具,并为RNA药物的设计和优化提供了新的见解。

6. Attention dual transformer with adaptive temporal convolutional for diabetic retinopathy detection

期刊:Scientific Reports

链接:https://doi.org/10.1038/s41598-025-92510-x

简介:本文提出了一种基于注意力双变换器和自适应时间卷积(ADT-ATC)的糖尿病视网膜病变(DR)检测模型,创新性地结合了双空间变换器和自适应时间卷积单元,以捕捉多尺度空间特征和长期时间依赖性。该方法通过双空间变换器处理不同尺度的视网膜图像特征,并利用自适应时间卷积单元捕捉时间序列中的依赖关系,最后通过分层交叉注意力模块融合时空特征进行分类。实验在DRIVE和糖尿病视网膜病变数据集上进行,结果表明ADT-ATC模型在DRIVE数据集上的准确率达到98.2%,在糖尿病视网膜病变数据集上的准确率为97.7%,显著优于传统深度学习模型。该模型在DR检测中表现出色,具有较高的临床应用潜力。

7. Advance in peptide-based drug development: delivery platforms, therapeutics and vaccines

期刊:Signal Transduction and Targeted Therapy

链接:https://doi.org/10.1038/s41392-024-02107-5

简介:本文综述了基于肽的药物开发的最新进展,重点介绍了肽类药物的递送平台、治疗应用和疫苗创新,强调了其在糖尿病、癌症和罕见病等领域的广泛应用。作者通过文献分析,总结了肽类药物的结构修饰原则、筛选和设计技术的最新进展,并探讨了其在精准医疗中的潜力。研究基于PubMed数据库的文献检索,涵盖了2005年至2024年的87,611篇文章,分析了肽类药物在不同疾病中的应用趋势和市场表现。实验结果表明,肽类药物在糖尿病和癌症治疗中表现出显著优势,尤其是GLP-1受体激动剂和肽-药物偶联物(PDCs)在临床中的应用前景广阔。本文为肽类药物的未来发展提供了全面的视角,展示了其在精准医疗中的巨大潜力。

8. Biomedical Foundation Model: A Survey

期刊:arXiv

链接:https://arxiv.org/abs/2503.02104

简介:本文综述了生物医学领域基础模型的应用与挑战,重点探讨了其在计算生物学、药物发现、临床信息学、医学影像和公共卫生等领域的潜力与进展。作者详细介绍了基础模型的预训练方法及其在下游任务中的适应能力,特别是在基因组信息、RNA表达谱、蛋白质结构预测和药物分子表示学习等方面的应用。实验部分涵盖了多个数据集,如BigBird、AlphaFold2、Med-PaLM等,展示了这些模型在各类生物医学任务中的卓越性能。总结指出,基础模型在生物医学领域的广泛应用将推动精准医学和公共卫生的发展,未来研究应继续探索其跨学科应用和优化方法。

9. dyAb: Flow Matching for Flexible Antibody Design with AlphaFold-driven Pre-binding Antigen

期刊:arXiv

链接:https://arxiv.org/abs/2503.01910

简介:本文提出了dyAb,一种结合AlphaFold2预测的抗原结构和流匹配技术的抗体设计框架,创新性地解决了抗原在结合过程中动态构象变化的问题。该方法通过粗粒度的界面对齐和细粒度的流匹配技术,模拟抗原-抗体复合物的相互作用和结构演化,提供了更真实的结合过程表示。实验在SAbDab和RAbD数据集上进行,结果表明dyAb在涉及抗原构象变化的抗体设计中显著优于现有模型,特别是在CDR-H3生成、亲和力优化和复合物结构预测任务中表现优异。dyAb为治疗性抗体的设计提供了更高效的开发周期和更好的临床应用前景。

10. QCS-ADME: Quantum Circuit Search for Drug Property Prediction with Imbalanced Data and Regression Adaptation

期刊:arXiv

链接:https://arxiv.org/abs/2503.01927

简介:本文提出了一种用于药物ADME属性预测的量子电路搜索框架QCS-ADME,创新性地解决了不平衡分类和回归任务中的量子机器学习电路评估问题。方法上,作者改进了现有的Elivagar评分机制,引入了加权矩阵处理不平衡分类,并采用高斯相似度度量适应回归任务。实验使用了TDC数据集中的Caco2(回归)和PAMPA(不平衡分类)任务,结果表明改进后的评分机制与测试性能呈中度正相关,且在回归任务中量子电路表现优于经典机器学习模型。该研究为量子机器学习在生物医学领域的应用提供了新的思路和方法。

11. RiboGen: RNA Sequence and Structure Co-Generation with Equivariant MultiFlow

期刊:arXiv

链接:https://arxiv.org/abs/2503.02058

简介:本文提出了RiboGen,首个能够同时生成RNA序列和全原子3D结构的深度学习模型,创新性地结合了Flow Matching和Discrete Flow Matching技术。RiboGen利用欧几里得等变神经网络处理三维几何数据,通过多流框架实现RNA序列和结构的联合生成。实验基于RNASolo数据集,筛选了6090个RNA结构进行训练,结果表明RiboGen能够生成化学合理且自洽的RNA样本,特别是在特定长度下表现出较高的结构一致性。RiboGen展示了多模态序列-结构生成在RNA建模中的潜力,为RNA设计和工程提供了新的工具。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-03-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MindDance 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档