首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

算法测评 | 如何选择合适的 PPI 检测方法以识别关键癌症通路

在本文中,我们提出了一种新的基于合成数据的基准框架,并进行了全面分析,以研究现有方法检测目标基因和亚网络的能力,以及如何控制假阳性,并探讨它们在基因和亚网络层面存在拓扑偏差时的表现。...我们的分析揭示了以前无法获得的算法性能见解。 根据基准研究的结果,我们为用户提供了关于如何选择适当的检测方法和蛋白质-蛋白质相互作用网络以识别癌症通路的实际指南,并就未来算法的发展提出了建议。...由于相互作用的蛋白质通常功能相关或协同工作,网络方法能够识别可能仍在癌症中发挥重要作用的低频基因。 此外,它们有助于检测揭示导致癌症进展的分子通路的聚类模式。...为此,对于目标亚网络中的每个基因,我们在一个蛋白质相互作用网络中计算了该基因的拓扑特征(例如度数),并计算了其在实验中的检测率,并进行了回归分析以揭示检测率与拓扑特征之间的关系。...对于聚类系数,我们注意到,在第一类方法(即DOMINO和HotNet2)中,对高程度节点施加惩罚的方法,其检测概率随着程度的增加而增加(补充图6)。

8500

数据库 | 最新版 STRING 数据库都更新了哪些内容?

该资源现在还提供了对聚类网络的改进注释,并向用户提供可下载的网络嵌入,这有助于在机器学习中使用STRING网络,并允许跨物种转移蛋白质信息。...Para_15 为了将这些相互作用整合到STRING中,我们采用了与物理相互作用相似的评分聚合和基准方法。...这些术语(列在 Y 轴上)按其富集信号排序,如果按相似性分组,则首先按其组的富集信号排序(图 2)。 这种可视化反映了用户选择的所有过滤设置,以管理显示结果的数量。...如果富集分析没有产生显著结果或者聚类仅包含一个基因,STRING将分配标准基因名称作为描述,以确保聚类易于识别。 该功能不仅限于聚类分析,还适用于任何基因集。...该API的一个应用是在stringApp Cytoscape插件中,它利用该插件在执行聚类后自动将分配的描述叠加到每个网络聚类上。

12710
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    全面预测蛋白质与所有生命分子相互作用及结构,引领药物研发新革命

    近年来,深度学习领域的迅速进步对蛋白质设计产生了显著影响。最近,深度学习方法在蛋白质结构预测方面取得了重大突破,使我们能够得到数百万种蛋白质的高质量模型。...2.3 蛋白质距离矩阵预测:预测蛋白质结构中所有残基对之间的距离或接近 程度。 2.4 图神经网络方法:捕捉蛋白质结构中残基之间复杂的相互作用和依赖关 系。 3....基于 AlphaFold2 做蛋白结构和序列新设计及结构聚类 2.1 AlphaFold2 如何实现蛋白质序列和结构的新设计 2.2 结构聚类与新功能发现 (a) Alphadatabase 数据库的结构分析与新功能发现...RNAseq与膜蛋白数据整合后分群 基因与蛋白表达相关性 多组样本转录组数据分析 质控、归一化 降维、聚类 鉴定marker基因,细胞亚群注释 样本间细胞亚群频率比较 样本间差异表达基因分析 绘制小提琴图....蛋白-多糖分子对接 4.1蛋白-多糖相互作用 4.2对接处理的要点 4.3蛋白-多糖分子对接的流程 4.4蛋白-多糖分子对接 4.5相关结果分析 以α-糖苷转移酶和多糖分子对接为例 5.核酸-小分子对接

    1.2K10

    ToppGene Suite中文使用指南

    (E和F)ToppNet - 训练和测试集基因被映射到蛋白质 - 蛋白质相互作用网络。在PPIN中使用全局网络距离测量方法,基于相对于所有训练集基因的相对位置对测试集基因进行得分和排序。 ?...以这种方式,可以保存两个基因列表之间的关系,同时还提供对多个基因列表中共有的和特有的基因功能和特征进行二次分析的数据文件及聚类。...下一步,我们利用热图或网络,两个都是基因组学中比较好的可视化工具产生基因cluster的富集地图。热图非常借助颜色密度值很好的展示数据集。...结果功能富集矩阵可以被等级聚类可视化,也可以热图,也可以输出为cytoscape支持的XGMML网络格式。...如果产生热图的选项被选择,功能富集矩阵就是二维等级聚类,先是行然后是列被重新排序,根据相似性得分。在表格格式,对重要性有贡献的特定的基因列表会以邻接表被提供。

    3.4K32

    Cell:对亚细胞蛋白质组进行全局表征,发现许多蛋白质是通过其空间分布的变化而非丰度变化来调节的

    内质网和溶酶体免疫沉淀获得了类似的结果,显示膜和腔内成分的类似富集(图S1F)。 我们的数据显示,一些细胞器之间的接触在天然免疫沉淀条件下得以保持。...将富集矩阵转换为k-最近邻图(1),然后使用Leiden聚类识别共富集的蛋白质(2)。基因本体论富集允许注释对应于单独亚细胞隔室的簇(3和4)。...完整的蛋白质和注释列表可以在表S3中找到。◉ 基于图的注释与OpenCell中的基于图像的注释的比较。在此比较中,仅考虑在OpenCell中注释为定位于单一隔室的蛋白质。...完整的蛋白质和注释列表可以在表S5中找到,附加的比较数据可以在Data S1中找到。...与图2相关的Leiden聚类和UMAP坐标。 下载:下载电子表格(2MB)表S4。与图2、图3和S6相关的蛋白质亚细胞定位总结注释。整合了基于图的、界面的和分类器的注释。

    12110

    最全面的蛋白质互作数据库,你了解多少?

    STRING数据库作为一个全面的蛋白质互作数据库,整合了实验证实的蛋白质-蛋白质相互作用关系(文本挖掘)、从基因组的特征计算得来的相互作用关系和基于直系同源的物种模型转移来的相互作用关系这三类数据。...01 输入目标蛋白 在我们的实例中,使用METTL3基因作为输入,选择物种为Homo sapiens,点击SEARCH。 点击continue,就可以得到输出的蛋白质互作网络图了!...03 富集分析 在得到蛋白质互作网络的同时,STRING还给我们提供了对蛋白质互作网络中的蛋白质进行GO和KEGG富集分析的功能。点击Analysis选项,即可查看富集分析的结果。...04 聚类分析 在Clusters界面中,数据库提供了K-means和MCL两种聚类方法,对蛋白质互作网络中的蛋白质进行聚类,选择一种方法,点击APPLY,得到的网络中蛋白质节点的颜色代表了蛋白质所代表的分类...06 网络的输出 在Exports界面,可以将蛋白质互作网络输出为图片格式(PNG),或者以表格信息的格式输出,从而在cytoscape等工具中进行进一步分析。

    2.8K20

    基于计算学方法的蛋白质相互作用预测综述

    下面,我们将回顾几种常用的数据库,根据所包含的信息,这些数据库被分为五类:蛋白质相互作用网络、蛋白质序列、高级结构、基因组信息、基因本体论。 ?...常见的能够被用于预测相互作用的网络结构信息包括共同邻居、网络路径、全局网络结构和几何嵌入四种。这四类方法能够从局部和全局的角度衡量蛋白质对拓扑相似性,以获取更高的预测性能。...因此,如何有效地整合多种生物信息资源以进行蛋白质相互作用预测仍然是未来需要解决的主要挑战之一。...(5)在基于网络预测蛋白质相互作用时,很少有模型会考虑局部网络结构和全局网络结构的互补性。此外,如何将蛋白质的生物学信息整合到相互作用网络中仍然是蛋白质相互作用预测需要解决的难题。...随着属性图聚类算法的兴起,将局部和全局网络结构与属性图聚类算法结合可能是未来蛋白质相互作用预测的重点。

    3.6K23

    单细胞个性化分析之转录因子篇

    转录因子(Transcription Factors,TFs),是指能够以特定序列与基因专一性结合,从而保证目的基因以特定的强度在特定的时间与空间表达的蛋白质分子。...在复杂多变的细胞微环境中,受到外界刺激的细胞是如何通过转录因子调节基因表达,从而调整细胞的转录状态以适应新的环境,尤其在肿瘤微环境中转录状态的转变,成为了单细胞数据分析不可或缺的一环。...绝大多数转录因子结合 DNA前需通过蛋白质-蛋白质相互作用形成二聚体或多聚体。所谓二聚体化就是指两分子单体通过一定的结构域结合成二聚体,它是转录因子结合DNA时最常见的形式。...除二聚化或多聚化反应,还有一些调节蛋白不能直接结合DNA,而是通过蛋白质-蛋白质相互作用间接结合DNA,调节基因转录,这样就形成了一个表达调控的复合物。...我们来看一下各步骤详解。这个地方要结合之前的转录因子背景来看。 图片 第一步:GENIE3——共表达网络构建 第一步由GENIE3或GRNBoost软件完成,这里以GENIE3为例介绍。

    1.9K40

    . | 多尺度相互作用网络鉴定疾病治疗机制

    实验结果表明,多尺度相互作用网络可以预测药物疾病的治疗,鉴定与治疗有关的蛋白质和生物学功能,并预测可改变治疗功效和不良反应的基因。...通过比较药物和疾病的扩散模式,多尺度相互作用网络能识别出可解释疾病治疗机制的相关蛋白质和生物功能。...图1 多尺度相互作用网络示例 2.2 扩散谱 为了解如何通过蛋白质和生物功能传播药物和疾病的作用,作者为每种药物和疾病学习一个扩散谱,用于识别受某药物或疾病影响最大的蛋白质和生物功能,从而揭示药物和疾病的作用如何在多尺度相互作用网络中传播...图2 药物—疾病治疗关系预测结果 3.2 识别治疗相关的蛋白质和生物功能 在该实验中,作者通过基因表达签名验证了扩散谱的生物学相关性。...从图3(f)中可以看出,如果药物具有更相似的扩散谱,则它们具有更多相似的基因表达特征,这表明扩散谱可以反映药物对蛋白质和生物功能的影响。

    39820

    由复合嵌入模型分解的单细胞成对关系

    研究CCC的传统方法包括低维空间中的聚类特征和推断已知细胞类型簇之间的相互作用。...然后,基于细胞间潜在主题空间的余弦相似度,构建细胞间交互网络并进行分层抽样,使主题-主题关系在SPRUCE训练的后续步骤中以相似的方式表示。...交互主题揭示潜在的癌症亚型特异性基因相互作用网络 SPRUCE还揭示了模型参数矩阵中特定主题的相互作用模式(图4),通过该模式可以估计基因-基因相关网络(配体与受体)。...SPRUCE概括了现有的生物信息学方法,并且不依赖于规定的细胞类型注释/聚类结果,这可能会在下游分析中引入不必要的偏差。...其中之一是假设已知的配体-受体蛋白质-蛋白质相互作用网络充当主题特异性相互作用网络的超集/主干。

    25220

    网络生物学的未来新方向

    生物网络的推断与比较 从非网络数据中推断出一个网络 计算机推断的生物网络可分为三大类:关联网络、相关网络和调控网络(图2A)。 物理蛋白质相互作用(PPI)网络通过高通量实验直接获得。...在这种情况下,网络比对的目的是在发现高度拓扑(通常是序列)保守区域的比较网络之间找到一个节点(蛋白质)映射,并假设结果对齐的节点和网络区域是进化保守或功能相似的。...为进一步利用超图,重要的是推广这种方法以应用于更大的图类,并将自动重构方法与手工策划结果统一起来。制定混合网络表示以结合配对图和超图的特征也可能有价值。...为提供全面评估,这些资源需要扩展以包括在各种图水平定义的任务,包括节点分类、链接预测、子图分类和聚类以及整图分类和回归。除了预测任务的模型基准测试外,还需要评估框架用于生成图模型。...与参考人类基因组相呼应,网络生物学的等价物可以是一个参考互作用组,即人类细胞内所有已知生物学相互作用的标准化和全面的地图。这将为研究疾病、发育、衰老和其他生物过程提供基线。

    76010

    2018 Cell系列相变最强综述,未来已来,你在哪?

    在这篇综述中,我们探究了日渐火热的无膜细胞器研究现状,针对无膜细胞器相关的生物发生、组织结构、动力学及调节机制和功能提出了自己的见解,同时讨论了最近该领域的研究结果如何帮助我们解析衰老相关的疾病的分子机制...这是一种物理过程,过饱和的组分溶液自发分离成密相和稀相两部分,然后稳定共存。P颗粒的类液体性质从它们的圆形外观(使表面张力最小化的结果)、可变形性(熔合和裂变事件)及组分的动态交换等特征中显现出来的。...例如,卵母细胞中的Balbiani bodies是由β折叠相互作用结合在一的类固体状蛋白质组装;相反,许多RNA-蛋白(RNPs)颗粒是动态和类液体状的,并且遗传实验已经证明IDRs有助于它们的组装;已知...这些多价蛋白可以进行凝胶化,从而形成物理交联的系统网络,其中交联是相关结构域/基序之间的非共价相互作用。蛋白质聚合物也可以通过密度转变缩合,从而形成与稀相共存的致密相。...TDP-43可通过LCDs中的瞬变的α螺旋二聚化进行相位分离,并且可以通过折叠的N末端结构域进行多聚化(图2B)。这表明对于一些蛋白质,相位分离可以通过两种不同的机制发生。

    2.2K10

    scRNA分析之后,如何看待结果和进行实验验证?这篇文章告诉你

    我们展示了sc/snRNA测序发现的具体示例,这些发现需要验证实验,涵盖了各种常见场景和方法。 尽管所选示例并不详尽,但它们展示了不同的验证步骤如何补充和确认sc/snRNA测序的结果。...验证聚类数量的进一步计算方法包括对每个聚类最富集的转录本的可视化(前10或前100),以及通过聚类在所有细胞中投射以创建基因表达特征图。...在候选聚类之外高表达的聚类富集基因表明过度聚类和分辨率过高,暗示这些聚类可能代表相同的细胞或细胞状态之间的微小变化。...然而,差异表达基因可以用于生成额外的假设,通过基于扰动的方法测试,以研究因果关系并将基因表达与细胞功能联系起来(图2)。 我们将在下一节中介绍具体的功能验证方法。...神经类器官的单细胞或单核剖析可以提供细胞类型分辨率的发育轨迹,能够扰动动态基因调控网络,模拟神经疾病机制,并支持神经发育的跨物种比较。

    12310

    . | 多尺度相互作用网络鉴定疾病治疗机制

    实验结果表明,多尺度相互作用网络可以预测药物疾病的治疗,鉴定与治疗有关的蛋白质和生物学功能,并预测可改变治疗功效和不良反应的基因。...通过比较药物和疾病的扩散模式,多尺度相互作用网络能识别出可解释疾病治疗机制的相关蛋白质和生物功能。...图1 多尺度相互作用网络示例 2.2 扩散谱 为了解如何通过蛋白质和生物功能传播药物和疾病的作用,作者为每种药物和疾病学习一个扩散谱,用于识别受某药物或疾病影响最大的蛋白质和生物功能,从而揭示药物和疾病的作用如何在多尺度相互作用网络中传播...图2 药物—疾病治疗关系预测结果 3.2 识别治疗相关的蛋白质和生物功能 在该实验中,作者通过基因表达签名验证了扩散谱的生物学相关性。...从图3(f)中可以看出,如果药物具有更相似的扩散谱,则它们具有更多相似的基因表达特征,这表明扩散谱可以反映药物对蛋白质和生物功能的影响。

    51430

    Nature子刊:高通量蛋白质组学方法学综述

    蛋白质组学作为蛋白质组实验和数据分析的结合,从整体上分析了蛋白质的组成、结构、表达、修饰状态以及蛋白质之间的相互作用和联系。它为基因组学和转录组学提供补充信息。...相比之下,液相色谱或高效液相色谱(HPLC)可以从复杂的混合物中连续分离数千种蛋白质,并可与质谱结合成为LC-MS,以提高通量。其中,反相液相色谱法(RPLC)是最常用的基于LC的分离平台。...SAM分析生成的图聚类和判别分析层次聚类算法(HCA)已被用于通过形成基于数学模型的树状图对大数据进行聚类。...IPA可以同时可视化和分析基因组学、蛋白质组学和代谢组学数据的跨数据库数据,以获得综合各种组学格式的信号网络和典型通路。...这种方法关注多个基因作为基因集表达的累积变化,这些基因集共享相似的生物功能、染色体位置或调控,而不是单个基因来识别通路。

    1.8K22

    Cell | 蛋白质-蛋白质相互作用在健康和疾病中的发现及其意义

    对于人类基因组而言,即使不考虑许多基因具有多种功能的问题,我们只能猜测大约20,000个蛋白质编码基因中的许多数千个基因的功能。 为了维持生命的存在,还有多少活动是我们完全不了解的?...对复杂混合物中的单个肽提供了更多识别信息的重要改进,从而极大地促进了来自大型基因组的蛋白质的鉴定,是液相色谱-串联质谱(LC-MS/MS)的发展,在这种技术中,肽通过液相色谱分离,然后在质谱仪中通过碰撞诱导解离...人们希望了解在细胞的不同部分蛋白质相互作用是如何改变的,以及当条件变化时,这些相互作用如何随时间而变化。 例如,最近的研究集中在DNA损伤响应期间和干细胞分化过程中PPI的变化。...例如,使用与神经退行性疾病相关的蛋白质变体生成了PPI网络,包括阿尔茨海默病(AD)、亨廷顿病和帕金森病。 许多蛋白质在比较突变体与其相应的野生型蛋白时显示出差异结合。...事实上,如果基因发现分析不是在单个基因水平上进行,而是使用蛋白质复合体和功能通路来进行,这样可以检测到这种生物学上的聚合(图3A)。 图3.

    18110

    Science | 一种在哺乳动物细胞中实现的合成蛋白质级神经网络

    为了探究类似的原理是否能够在活细胞内实现计算,研究人员结合全新设计的蛋白质异源二聚体和工程化的病毒蛋白酶,构建了一个执行“胜者为王(winner-take-all)”神经网络分类的合成蛋白质电路。...完整系统在哺乳动物细胞中实现了具有可调决策边界的多输出信号分类,并可用于有条件地调控细胞死亡。这些结果展示了如何通过工程化蛋白质网络,实现活细胞内的可编程信号分类。 细胞是天然的分类机器。...所有节点蛋白共享相同的重组域,以确保类似的蛋白酶重组动力学。 该设计实现了输入的加权求和。...我们将这些系统称为Perceptein网络,类似于人工神经网络架构中的感知器。 建模与仿真 研究人员通过简化的蛋白质相互作用模型对系统进行仿真。...当输入数量等于节点数量时,进一步简化电路,去除交叉相互作用,构建了一个更简单的比较器。实验结果显示,该简化电路依然保留了输入分类的能力,并与仿真结果高度一致。

    12210

    万字综述|一文掌握深度学习与语言模型在微生物组研究中的应用

    学习到的注意力模式提供了低分辨率的蛋白质结构,对应于残基接触图。...4.2 深度学习和LLM方法用于病毒-宿主相互作用 病毒组研究中的一个重要问题是预测哪些病毒可以感染哪些宿主,这对于理解病毒如何与宿主相互作用并引起疾病至关重要。...MetaBGC整合了分段pHMM与聚类策略,使其能够直接从宏基因组读取中检测BGCs。...许多将肠道微生物组与复杂疾病(如IBD和克罗恩病)联系起来的发现都可以在单独的科学出版物中找到。手动聚合这些公共领域中的结果到一个有组织且可搜索的存储库中将是耗时的,并且仅限于一小部分微生物和疾病。...MetaBGC纯化并解析了五个新的II型聚酮分子的结构,其中两个显示出强大的抗菌活性。未来,我们预计会有更多的跨学科合作来促进这种实践,并特别开发标准化协议,以在真实生物系统中验证AI生成的发现。

    24310

    GO和KEGG富集分析(Metascape数据库)

    而Metascape每月更新其相关的40多个数据库,以确保提供最准确的结果。因此Metascape数据库可以作为富集分析的比较好的手段。...它目前支持常见的模式生物的富集分析,蛋白质 - 蛋白质相互作用网络,其结果可以自动呈现为科满足科研杂志要求的形式,同时可以输出为Excel和PowerPoint演示文稿满足科研交流。...此外,丰富的GO本体术语自动聚类以减少冗余以便于解释。蛋白质 - 蛋白质相互作用网络基于BioGRID,OmniPath,InWeb_IM构建,并且识别密集组分并进行生物学解释。...Metascape整合了GO、KEGG、UniProt和DrugBank等多个权威的数据资源,使其不仅能完成通路富集和生物过程注释,还能做基因相关的蛋白质网络分析和涉及到的药物分析。...比如说默认把Reactome、KEGG、Hallmark和GO数据库全部一起展示,但是一般我们科研绘图时会分别展示GO一张图,以及KEGG一张图。

    6.6K30

    STRING:蛋白质相互作用(PPI网络)数据库简介

    研究蛋白之间的相互作用网络,有助于挖掘核心的调控基因,目前已经有很多的蛋白质相互作用的数据库,而string绝对是其中覆盖的物种最多,相互作用信息做大的一个,网址如下 https://string-db.org...检索完成之后,会得到如下所示的结果 ? 上述的网络我们就称之为蛋白质相互作用网络,protein-protein interaction network, 即PPI网络。...在Analysis页面,对于蛋白质相互作用网络中的基因,提供了GO和KEGG富集分析的结果,示意如下 ?...对于一个包含许多节点的蛋白质相互网络,还可以通过Cluster页面来挖掘其中的子网sub network, 或者也可以称之为module, 本质上是对基因进行聚类,属于同一类的基因所构成的相互作用网络就是一个...支持kmeans和MCL聚类,聚类的结果为TSV格式,从中可以看出哪些基因属于同一类。

    7.6K41
    领券