Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >​cytoscape的十大插件之五--Centiscape(计算多个中心值)

​cytoscape的十大插件之五--Centiscape(计算多个中心值)

作者头像
生信技能树
发布于 2021-05-27 07:34:50
发布于 2021-05-27 07:34:50
8K0
举报
文章被收录于专栏:生信技能树生信技能树

五一劳动节,连续五天,在钉钉群直播互动授课带领大家系统性掌握cytoscape软件的使用方法和技巧,课程已经结束啦。文末有录播回放学习方式,以及配套授课资料!

下面是cytoscape讲师的笔记

一、初识

  • 据文献介绍,Centiscape是目前唯一能同时计算多个中心值的Cytoscape插件。在Centiscape上,通过计算出中心值或者用从实验中得到的生物参数排序,能够从网络上得到关键节点。

二、名词解释

  • 先了解一些拓扑网络参数,之后会用到插件中

0. 基本概念

  • G=(V,E):有向网络,或无向网络
  • dist(v,w):节点v 和 节点w 间的最短距离
  • σst :任意任意两点最短距离数目
  • σst(v):最短距离中经过节点v 的数目
  • 什么是最短距离??
  • 如下面网络,v→w 有两条路:v-b-c-w;v-a-w
  • v-a-w经过边和节点数最少,即为两节点的最短距离

1. Diameter (∆G,直径)

  • 定义:网络中任意两节点最短距离中的最长距离
  • 作用:
    • 展示了网络内任意节点的最长距离
    • 如果网络的直径大,不一定是分散型网络。因为也有可能存在网络内只有两个节点距离较远,而其他节点比较密集;但如果网络的直径小,可证明其为紧密型网络
    • 网络的直径一般与节点数目一起比较。如一个大的网络(节点数目多),直径小会比同样直径小的小网络更有意义。
    • 通过直径可判断网络的发展
  • 意义:
    • 如果是PPI网络,直径小可认为蛋白间相互作用的程度高。如果网络内具有单独的节点(没有连接边),直径应该需要加权处理。

2. Average Distance (AvDG,平均最短距离)

  • 定义:网络中任意两节点最短距离的平均值
  • 作用:一般不是整数。平均最短距离的作用与直径类似,但更有意义。也是与节点数目一起比较,判断网络分散或密集型。
  • 意义:
    • 如果是平均最短距离低的蛋白网络,可认为网络是紧密型,有倾向于形成功能性复合物或模块的趋势。

3. Degree(度)

  • 定义:
    • 无向网络(如PPI):与节点v直接相连的节点数目,同样对应连接边的数目
    • 有向网络:当箭头指向节点v,其数目成为 in-degree;当箭头背对节点v,指向临近点时,其数目成为 out-degree
  • 作用:
    • 判断网络的分布
    • 如呈高斯分布(Gaussian distribution ),证明网络没有高度集中的节点,此为随机,非自然的网络
    • 如呈幂律度分布(power-law degree distribution ),证明网络存在少数节点具有较高的度。
    • 能够评估网络节点的调控性。如在网络中,如果某蛋白有high degree,就证明其和很多其他蛋白具有相关性,可认为其是关键蛋白。

4. Stress (Cstr(v),应力)

  • 定义:
    • 代表节点中心值的指标
    • 首先计算网络中任意两点的最短路径数目,然后其中经过v点的最短路径,就是节点v的应力
  • 作用:
    • 值得注意是,若节点v应力高,并不意味着节点v是任意两个节点间的关键点,可能它们之间的最短路径没有经过节点v
  • 意义:
    • 在PPI网络中,若该节点的应力高,证明其蛋白质能将其他节点蛋白连接起来的能力强。

5. S.-P. Betweenness (Cspb(v),中间度)

  • 定义:
    • 代表节点中心值的指标,与 Stress相似,但含有更多的意义
    • 首先计算网络中任意两点的最短路径数目总和,然后计算其中经过v点的最短路径的数量与总和的比
    • 如果节点n只相连 v1 和 v2,且 v1 和 v2 的最短路径也是经过v,则节点n拥有很高的中间度,但应力小(因为应力只计算经过v点的最短路径的数量,不是计算比值)
  • 意义:
    • 在PPI网络中,若该节点的中间度高,证明其蛋白质为关键蛋白。

6. Radiality (Crad(v),径向度)

  • 定义:
    • 代表节点中心值的指标
    • 若计算节点v的径向度,先求出其与网络任意节点的最短距离,后用(直径+1)减去它,得到的数值求总和,最后除以(节点数目-1)
  • 作用:
    • 一般与网络的平均径向度作比较
    • 径向度高,意味着其他点均接近节点v;径向度低,意味着其他点均远离节点v
    • 同样,不应过多关注单个节点的径向度,应把其当作节点紧密或远离程度的趋势;
    • 建议和离心率,紧密度一起对节点进行评估,若某节点高紧密度,高离心率,高径向度那就很有可能是网络的中心。
  • 意义:
    • 与平均径向度相比,高径向度的节点更容易成为网络的中心;但径向度低的节点也有意义,虽然与特定的网络可能不太相关,但有可能与其他调控网络相关,成为连接不同网络的交界点。
    • 此参数与紧密度,离心率的意义差不多

7. Closeness (Cclo(v),紧密度)

  • 定义:
    • 代表节点中心值的指标
    • 若计算节点v的离心率,先求出其与网络任意节点的最短距离,后求其总和,最后求倒数
  • 作用:
    • 一般与网络的平均紧密度作比较
    • 紧密度高,意味着其他点均接近节点v;紧密度低,意味着其他点均远离节点v
    • 特殊情况:紧密度高也有可能因为存在某些节点离v近,但有部分离得远;紧密度低也有可能。
    • 因此,不应过多关注单个节点的紧密度,应把其当作节点紧密或远离程度的趋势;
    • 建议和离心率一起对节点进行评估,若某节点高紧密度,高离心率,那就很有可能是网络的中心。
  • 意义:
    • 与平均紧密度相比,高紧密度的节点更容易成为网络的中心;但紧密度低的节点也有意义,虽然与特定的网络可能不太相关,但有可能与其他调控网络相关,成为连接不同网络的交界点。

7. Centroid value (Ccen(v),质心值)

  • 定义:
  • γv(w) 是相比于靠近节点w,更靠近节点v的数目
  • γw(v) 同理,最后相减求出最小值
  • 此为最复杂的节点中心值的指标
  • 作用:
    • 因为此参数包含了与其他节点做对比,因此是个权重的结果
    • 高质心值的节点,意味着它有很多个邻近点(不单指第一邻近点)
  • 意义:
    • 相对于平均值,高质心值的点更有可能参与协调其他高度连接蛋白的活性,共同致力于某一特定细胞活性的调控(如细胞黏附,基因表达,增值等)
    • 因此,有高平均质心值的网络,更有可能形成功能性聚类模块,而低平均质心值的网络,更有可能形成连接不同功能的蛋白簇。
    • 建议与与能够计算出蛋白质网络调控关键模块的算法进行比较,如MCODE等

9. Eccentricity (Cecc(v),离心率)

  • 定义:
    • 代表节点中心值的指标。
    • 若计算节点v的离心率,先求出其与网络任意节点的最短距离,后挑选出最大的值,即为最短距离中的最长距离,最后求其倒数
  • 作用:
    • 当节点v的离心率高时,即最短距离中的最长距离比较小,意味着其他节点很接近。
    • 当节点v离心率低时,意味着至少有一个节点离节点v远
  • 意义:
    • 一般与网络的平均离心率作比较
    • 若某节点的离心率比较高,意味着更容易受到其他节点蛋白的影响(更复杂的调控)

10. Eigenvector Centrality(特征向量中心性)

  • 使用了Google’s Page Rank算法,特征向量中心性计算可看作一个加权的处理。
  • 特征向量中心性,不仅取决于相邻节点的数量,也取决于相邻节点的重要性
  • 意义:
    • 与degree相似,高特征向量节点,意味着网络内的关键蛋白,提供主要调控作用
    • 低特征向量节点,可认为是外周蛋白,连接着少量关键蛋白

11.Bridging Centrality(桥接中心性)

  • 定义:
    • the Bridging Coefficient (BC) and the Betweenness centrality (Btw)
    • BC*BW
    • 若该节点相连临近点有 high degree,则该点桥接中心性高
  • 意义:
    • 若某节点拥有高桥接中心性,意味着它调控着重要蛋白或被调控,可认为是蛋白网络的关键靶点

12. Edge Betweenness(边中心性)

  • 定义:
    • 代表边的中心性指标
    • 若计算edge E 的边中心性,先计算网络任意两点的最短距离,后求其经过edge E 的数量
  • 作用:
    • 若边中心性高,则证明在蛋白网络中,此调节过程更重要
    • 在信号网络中,边中心性高意味着维持功能和信号机制的一致性

三、操作演示

1. 安装

  • 可参考前面推送步骤

2. 载入数据

  • 首先从一个网络开始,构建PPI网络
  • 具体如何构建网络,可前面推动步骤

3. 分析

3.1 选择对应插件功能

3.2 选择对应计算参数

可了解右方问号看对应参数解释

3.3 选择网络类型

  • 此为PPI网络,选择无向网络(for undirected networks)
  • 另外选择:
  • 给边赋予一个属性,在计算最短距离时进行加权
  • 若两点之间有两条连线都是相同数目的边,这时需确定加权数,来确定最短距离
  • 有向网络(for directed networks):节点之间存在调控作用,如节点a到节点b的作用,不能说节点b到节点a
  • 加权边(weighted edges)

4. 结果

  • 具体数值结果在网络下方呈现
  • 网络右边还有具体调控参数
  • 右方是默认求出各参数平均值,≥阈值的节点会在网络下方的表格出现
  • 可划动调控阈值范围,也可以选择≤阈值的节点,点解 update 后,网络下方结果表格会发生变化
  • 下面以条形图呈现不同节点的中心值
  • 蓝色:平均值;绿色:最小值;白色:最大值;红色:该节点中心值;
  • 最下方可确定 x轴,y轴,绘制不同参数的散点图,可观察它们的相关性趋势

四、总结

  • 我们可以看到Centisacpe这个插件有12个参数可以选择,那如果我们要得到PPI网络的关键基因,应选哪些参数最为合适呢?这个我们可以从文献中得到答案
  • 今天这篇3.9分 Protein network exploration prioritizes targets for modulating neuroinflammation in Parkinson's disease 的文章,选用 degree 和 betweenness 两个参数,并最后选择高于其平均值的7个基因进行后续分析
  • https://pubmed.ncbi.nlm.nih.gov/33756233/
  • 这篇文献 Bioinformatics analysis of vascular RNA-seq data revealed hub genes and pathways in a novel Tibetan minipig atherosclerosis model induced by a high fat/cholesterol diet
  • 选择degree,betweenness,eigenvector 三个参数,高于其的基因取交集进行分析
  • https://pubmed.ncbi.nlm.nih.gov/32213192/
  • Centiscape,CytoHubba,MCODE 都可以筛选出关键基因或模块,但是使用了不同算法进行,大家可以根据筛选出来的基因数量使用其中一种或多种方法进行选择
  • 参考资料:
  • https://f1000research.com/articles/3-139
  • https://academic.oup.com/bioinformatics/article/25/21/2857/227713
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-05-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
寻找网络中的hub节点
其实转录组走到现在我总觉得少了点什么东西,后来才想起来是cytospace寻找hub基因
生信菜鸟团
2023/09/27
1.7K0
寻找网络中的hub节点
Cytoscape插件1:Centiscape
Cytoscape的插件或多或少都有一些弊端,Centiscape是目前(文章时间2009)唯一一个可以一次计算多个中心值的插件(相对于network analysis等).它可以根据拓扑和生物学属性寻找最显著差异的基因。它只适合于无向网络,可以计算的参数有(average distance,diameter直径,degree度数,stress压力,betweenness中介性,radiality放射性,closeness紧密度(接近中心性),centroid value质心值,eccentricity离心值。插件的帮助文件有以上的定义,描述,生物学意义和计算的复杂性。每个参数的max,min,mean值都有提供。还可以可视化。右边的滑动块可以调整作者的值(默认是mean)。如果必要的话,可以把其中几个参数给deactive掉,也就是不勾选acitive复选框。用户可以选择其中几个参数more/equal而另外的选择less/equal,也可以假如AND-OR 参数。这些可以马上知道结果例如“哪些节点有高中介性值和高stress同时低离心值?”要注意的是,threshold也可以手动设置。一旦根据用户的选定设置,相应的子图就可以提取显示。两类图的输出可以被支持,根据centrality 画图,根据node画图,以上两种都支持其他工具所不支持的分析。 The plot by node 可以提供任何一个node 的所有计算的centiscape值,并以bar 图展示。Mean,max,min以不同颜色显示。图中的所有值都是标准化的,当用鼠标指向某一个时候显示的是真实值。 The plot by centrality 根据中心性画图。可以有五种方式画图 1 centrality vs centrality 2.centrality vs experimental data 3.experimental data vs experimental data 4.centrality vs itself 5.experimental vs itself 仔细看怎么用(plot by centrality可以发掘根据特殊的拓扑或实验特性聚成一类的群。并可以提取子网络进一步分析。拓扑特性和实验数据的结合可以用来对子网络的功能进行更多的有意义的预测或实验证实。 文章作者然后用一个例子来具体说明 整个网络的拓扑性质的总体会首先看到诸如min,max,mean等。例如,degree的平均值是13.5,平均距离是3显示这是一个高度连接的网络,也就是其中蛋白发生了强烈的相互作用。为了找到最高分蛋白的找出,我们可以应用“plot by centrality”。 画degree over degree,显示,分布是不均匀的,大多数nodes有低degree,很少的有高degree的。这和已知的生物网络的无尺度架构一致。下面这个是我的ucco的值,结果差不多,低degree的多余高degree的。
Y大宽
2019/02/25
2.6K0
Cytoscape插件1:Centiscape
基于networkx分析Louvain算法的社团网络划分
一个图G = (V, E)由一些点及点之间的连线(称为边)构成,V、E分别计G的点集合和边集合。在图的概念中,点的空间位置,边的区直长短都无关紧要,重要的是其中有几个点以及那些点之间有变相连。
用户7886150
2020/12/24
3.7K0
Cytoscape插件2:CytoHubba
CytoHubba:发现复杂网络的关键目标和子网络 网络对呈现包括PPI,基因调控,细胞路径和信号转导等多种类型生物数据非常有用。我们//+重要性,并且这也能帮助我们发现网络中的中心元素。 cytoHubba根据nodes在网络中的属性进行排名。它提供了11中拓扑分析方法,包括,Degrre度,Edge Percolated component边过滤成分,Maximum neighborhood component,Density of Maximum Neighborhood Component,Maximal Clique Centrality and six centralities(Botteleneck,EcCentricity,Closeness,Radiality,Betweenness, Stress)以上这些基于最短路径,MCC是新提出的方法,在酵母PPI网络中对关键蛋白的预测有更好的表现。比如依据给定的重要性概念对网络中心性对节点进行排名可以发现重要信息。 研究发现,一个蛋白的degree和他的基因的重要性直接相关,换句话说,具有高degree的蛋白更倾向于是关键蛋白。 已经有几个插件可以对网络数据进行节点排名,比如NetworkAnalyzer和CentiScaPe,他们可以计算有向或无向网络的拓扑参数。这些插件比其他常用的插件提供了更多的中心性测定指标,但是一些其他重要的特性和最近发展的方法他们并未包括进去。不同的方法聚焦不同的拓扑特点或者,相似的特征有着不同的计分策略。为了让生物工作者对网络特点的利用更加辩解,我们编写了cytoHubba插件以执行我们最新发展的算法和几个流行的算法。 加强的node 获取功能控制面板可以帮助研究者搜索和探索网络,并且可以提取感兴趣的子网络。 使用方法 CytoHubba界面提供了一个简单的交互界面有11个得分方法的分析界面。 首先,所有11中方法在每个node中的得分都会被赋予,当然前提是加载了PPI网络,并执行了“compute hubba result”功能。
Y大宽
2018/09/10
6.6K0
Cytoscape插件2:CytoHubba
如何从PPI网络进一步挖掘信息
从数据库中得到蛋白质的相互作用信息之后,我们可以构建蛋白质间的相互作用网络,但是这个网络是非常复杂的,节点和连线的个数很多,如果从整体上看,很难挖掘出任何有生物学价值的信息,所以我们需要借助一些算法来深入挖掘。
生信修炼手册
2020/05/08
1.3K0
如何从PPI网络进一步挖掘信息
半个【弗洛伊德算法】2-3 社交网络图中结点的“重要性”计算 (25分)
在社交网络中,个人或单位(结点)之间通过某些关系(边)联系起来。他们受到这些关系的影响,这种影响可以理解为网络中相互连接的结点之间蔓延的一种相互作用,可以增强也可以减弱。而结点根据其所处的位置不同,其在网络中体现的重要性也不尽相同。
韩旭051
2020/06/23
5750
半个【弗洛伊德算法】2-3 社交网络图中结点的“重要性”计算 (25分)
关于图算法 & 图分析的基础知识概览
网址:https://learning.oreilly.com/library/view/graph-algorithms-/9781492060116/
机器之心
2019/05/17
3.2K0
PTA 社交网络图中结点的“重要性”计算(30 分)
该文介绍了计算给定社交网络图中结点的重要性,以及基于紧密度中心性、介数中心性和接近中心性等指标的计算方法。首先介绍了相关概念和计算方法,然后给出了一些示例和输入输出格式。
Kindear
2017/12/29
1.1K0
PTA 社交网络图中结点的“重要性”计算(30 分)
PageRank、最小生成树:ML开发者应该了解的五种图算法
在互联世界中,用户不能被视为独立的实体。他们之间存在一定的关系,我们有时希望在构建机器学习模型时考虑到这些关系。
机器之心
2019/09/10
1.1K0
PageRank、最小生成树:ML开发者应该了解的五种图算法
社交网络图中结点的“重要性”计算
在社交网络中,个人或单位(结点)之间通过某些关系(边)联系起来。他们受到这些关系的影响,这种影响可以理解为网络中相互连接的结点之间蔓延的一种相互作用,可以增强也可以减弱。而结点根据其所处的位置不同,其在网络中体现的重要性也不尽相同。
叶茂林
2023/07/30
2390
关键点挖掘
当科学家共同写一篇论文,或者写一本书。通过网络连接,找出哪些科学家有更大的影响力。
DC童生
2019/05/15
1K0
小世界网络
在网络理论 的研究中,复杂网络是由数量巨大的节点 和节点之间错综复杂的关系共同构成的网络 结构。用数学的语言来说,就是一个有着足够复杂的拓扑 结构特征的图 。复杂网络具有简单网络,如晶格网络 、随机图 等结构所不具备的特性,而这些特性往往出现在真实世界的网络结构中。复杂网络的研究是现今科学研究中的一个热点,与现实中各类高复杂性系统,如的互联网 、神经网络 和社会网络 的研究有密切关系。
Defu Li
2019/03/12
3.7K0
小世界网络
关于图计算&图学习的基础知识概览:前置知识点学习(Paddle Graph L)系列【一】
关于图计算&图学习的基础知识概览:前置知识点学习(Paddle Graph Learning (PGL)) 欢迎fork本项目原始链接:关于图计算&图学习的基础知识概览:前置知识点学习(Paddle
汀丶人工智能
2022/11/18
9120
一文学会网络分析——Co-occurrence网络图在R中的实现
编者按:上个月菌群月坛,在军科院听取王军组陈亮博士分享网络分析的经验,不仅使我对网络的背景知识有了更全面的认识,更使我手上一个关于菌根的课题有极大的启示。这么好的知识,当然希望和大家分享,故约稿陈博士在“宏基因组”发布一下他的经验,感谢陈博士的整理和分享。下面是正文:
生信宝典
2019/05/09
9.9K32
一文学会网络分析——Co-occurrence网络图在R中的实现
SNA中:中心度及中心势诠释(不完整代码)
 SNA社会关系网络分析中,关键的就是通过一些指标的衡量来评价网络结构稳定性、集中趋势等。主要有中心度以及中心势两大类指标。 以下的代码都是igraph包中的。 ———————————————————————————————————————————————— 中心度指标的对比 指标名称 概念 比较 实际应用点度中心度 在某个点上,有多少条线 强调某点单独的价值 ★作为基本点的描述接近中心度 该点与网络中其他点距离之和的倒数,越大说明越在中心,越能够很快到达其他点 强调点在网络的价值,越大,越在中心 ★★
学到老
2018/03/16
2.5K0
【实战帖】使用Python分析社交网络数据
目录 数据抓取 一、直接抓取数据 二、模拟浏览器抓取数据 三、基于API接口抓取数据 数据预处理 可视化 数据分析 扩散深度 扩散速度 空间分布 节点属性 网络属性 传播属性 在线社交网站为人们提供了一个构建社会关系网络和互动的平台。每一个人和组织都可以通过社交网站互动、获取信息并发出自己的声音,因而吸引了众多的使用者。作为一个复杂的社会系统,在线社交网站真实地记录了社会网络的增长以及人类传播行为演化。通过抓取并分析在线社交网站的数据,研究者可以迅速地把握人类社交网络行为背后所隐藏的规律、机制乃至一般
机器学习AI算法工程
2018/03/13
8K0
【实战帖】使用Python分析社交网络数据
R语言︱SNA-社会关系网络—igraph包(中心度、中心势)(二)
SNA社会关系网络分析中,关键的就是通过一些指标的衡量来评价网络结构稳定性、集中趋势等。主要有中心度以及中心势两大类指标。
悟乙己
2019/05/27
8.2K0
C++ 图论之Floyd算法求解次最短路径的感悟,一切都是脱壳后找最值而已
学霸刷完 200 道题,会对题目分类,并总结出解决类型问题的通用模板,我不喜欢模板这个名词,感觉到投机的意味,或许用方法或通用表达式更高级一点。而事实上模板一词更准确。
一枚大果壳
2023/12/10
2620
C++ 图论之Floyd算法求解次最短路径的感悟,一切都是脱壳后找最值而已
聚类方法 学习总结
1)聚类的核心概念是相似度(similarity)或距离(distance),有多种相似度或距离的定义。因为相似度直接影响聚类的结果,所以其选择是聚类的根本问题。
全栈程序员站长
2022/09/27
1.1K0
图神经网络(01)-图与图学习(上)
图(graph)近来正逐渐变成机器学习的一大核心领域,在开始PGL框架学习之前,我们先简单学习一下图论的基本概念,图论的经典算法,以及近些年来图学习的发展。
致Great
2021/01/27
3K0
图神经网络(01)-图与图学习(上)
推荐阅读
相关推荐
寻找网络中的hub节点
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档