写在开头
上期推文基于STRING网站,使用差异基因进行了蛋白互作网络分析——STRING网站:蛋白互作分析的高效利器
我们也从网站上得到并下载了网络分析的结果数据,接着就可以基于cytoscape软件进行进一步的可视化以及美化。
那这期我们就一起来学习一下cytoscape软件下载安装以及使用过程。
cytoscape软件下载安装
首先是直接搜索cytoscape找到对应的网站,然后找到下载选项,下载对应的版本
使用本地版的cytoscape进行分析,所以需要先将软件下载到本地
会从官网下载一个222MB的软件到本地,然后找到下载得到的exe文件,双击进行安装
貌似是需要下载一下java才可以
按照提示下载对应的java版本即可
然后可以正常安装cytoscape
确定好需要安装的位置,然后安装即可
因为在安装的时候,确定创建快捷方式,所以可以直接在桌面找到对应的应用程序,双击打开即可
整理需要的数据
在Cytoscape软件中进行蛋白互作网络可视化通常需要的数据:
- 蛋白质互作数据:可以从公共数据库如STRING获得,,用于定义网络中的节点和边。具体的分析及获取方式,在上一篇推文STRING网站:蛋白互作分析的高效利器整理过了的
从string网页获得string_interactions.tsv
- 差异基因表达数据:可以是如logFC(对数倍数变化)等数值型数据,这些数据可以映射到网络节点上,用以表示基因表达的变化。在Cytoscape中,属性数据(如实验数据或文本注释)可以映射到生物网络中,帮助在同一图表中可视化多种类型的数据,从而识别不同类型数据之间的模式和关系。
按需要提取差异基因的基因"symbol","logFC"列
# 2.准备cytoscape的输入文件
p = deg[deg$change != "stable",
c("symbol","logFC")]
head(p)
write.table(p,
file = "deg.txt",
sep = "\t",
quote = F,
row.names = F)
# string_interactions.tsv是网络文件
# deg.txt是属性表格
导入数据到Cytoscape软件
在Cytoscape软件中,有两个主要的导入数据选项:Import Network from File System 和 Import Table from File System。这两个选项用于导入不同类型的数据。
1.Import Network from File System(从文件系统导入网络):
- 这个选项用于导入网络数据文件,即包含节点(nodes)和边(edges)信息的文件。
- 导入的文件通常包含网络的结构信息,如节点之间的连接关系、节点属性(如名称、类型等)和边属性(如权重、类型等)。
- 支持的文件格式包括SIF(Simple Interaction Format)、GML(Graph Modeling Language)、XGMML(eXtensible Graph Markup and Modeling Language)、GraphML等。
- 导入后,Cytoscape会创建一个新的网络视图,显示节点和边的图形表示。
2. Import Table from File System(从文件系统导入表格):
- 这个选项用于导入表格数据文件,即包含节点或边的属性信息的文件。这里导入的是差异基因表达数据,这些数据可以映射到网络节点上,用以表示基因表达的变化。
- 导入的文件通常包含与网络中的节点或边相关的额外数据,如基因表达水平、功能注释、实验结果等。
- 支持的文件格式包括CSV(Comma-Separated Values)、TSV(Tab-Separated Values)、Excel等。
- 导入后,Cytoscape会将表格数据与现有的网络视图中的节点或边进行关联,以便在网络中显示这些属性信息。
Cytoscape可视化蛋白互作网络
在Cytoscape中导入数据之后,可以通过以下步骤对网络进行美化和优化,以提高可视化效果和分析的便利性:
设置节点和边的样式
- 在Cytoscape左侧的“Style”面板中,可以调整节点和边的视觉样式:
按照小洁老师课上整理的对节点进行一些调整
节点形状
根据需要选择不同的形状,如圆形、方形、三角形等。
- 在Style面板中,找到“Shape”选项。这是控制节点形状的属性。
- 点击“Shape”旁边的小箭头,然后选择“Column”来根据特定列的值设置形状。
- 在弹出的对话框中,选择包含你想要映射的形状信息的列。
- 完成设置后,点击“Apply”按钮应用样式。
- 网络中的节点将根据所选列的值自动显示为相应的形状,但是可能由于展示的大小问题,会导致修改后没办法直接看到选择的形状,这个时候放大可视化结果即可。
节点颜色
根据节点属性(如表达水平、功能类别等)设置不同的颜色。比如想要根据logFC值设置节点的填充颜色,在Cytoscape的“Style”面板中进行调整。
- 在Style面板中,找到“Fill Color”选项。这是控制节点填充颜色的属性。
- 点击“Fill Color”旁边的小箭头,然后选择“Column”来根据特定列的值设置颜色。
- 在弹出的对话框中,选择包含logFC值的列。这通常是一个包含数值数据的列,如“logFC”或类似的名称。
- 选择“Mapping Type”为“Continuous Mapping”(连续映射),因为logFC值通常是连续的数值。
- 选择一个合适的颜色渐变,例如从蓝色到红色,以表示从负到正的logFC值。
- 完成设置后,点击“Apply”按钮应用样式。
- 网络中的节点将根据logFC值自动填充相应的颜色。
最后可以选择需要的结果及数据进行保存和导出。
插件安装
在Cytoscape 3.10.3版本中没有“App Manager”,安装插件的过程与之前版本有所不同。
1. 点击顶部菜单栏中的“Apps”,在下拉菜单中选择“App Store”。
点击“Show App Store”即可打开需要的页面
2. 在App Store中,可以搜索你需要的插件。输入插件名称,比如“ClueGO”、“MCODE”等,会跳转到对应的网页,选择是否进行下载
3. 找到插件后,点击“Install”按钮进行安装。下载完成后会在软件中看到下载的插件
cytoHubba插件找hub基因
- 点击Apps里载入cytoHubba。
- Target Network选择待分析的网络。
- 点击Calculate进行计算,计算完之后点击Top 10,可根据自身需要,调整提取关键基因的数量。
- 选择计算方法,这里可以选MCC(Maximum Clique Centrality,最大团中心性)。
- Particular nodes:选择感兴趣的基因进行分析(一般是对整个网络分析的话,此项可以忽略)。
- 点击左下方的选项,如Check the first-stage nodes显示出hub gene连接到的第一个节点,Display the shortest path显示最短的路径(一般选这个),Display the expanded subnetwork显示出最长的子网络。
- 右边的列表就显示关键基因的排名:颜色越深,证明分数越高,越显著。
- 下方可选择Save Current Rank来保存当前的排名结果。
cytoHubba插件提供了多种拓扑分析方法:
- 包括Degree (度中心性)
- EPC (Edge Percolated Component,边缘渗透组件)
- MNC (Neighborhood Component Centrality,邻域组件中心性)
- BNC (Biological Network Centrality,生物网络中心性)
- Bottleneck (瓶颈中心性)、EcCentricity (离心率中心性)
- Closeness (紧密中心性)、Betweenness (介数中心性)
- Clustering Coefficient (聚类系数)
- DMNC (Maximum Neighborhood Component Centrality,最大邻域组件中心性)
- MCC (Maximum Clique Centrality,最大团中心性)等。
结果理解
- 枢纽基因(Hub Genes): 图中红色标记的节点代表枢纽基因。这些基因在蛋白质相互作用网络中具有较高的连接度,意味着它们与许多其他蛋白质有相互作用,可能在调控网络中起到关键作用。
- 排名(Ranking):右侧的表格显示了枢纽基因的排名。排名是基于所选算法(如MCC,最大团中心性)计算得出的,数值越高,表示该基因在网络中的重要性越大。
- 例如,图中排名第一的基因是FN1,这意味着它在网络中可能是最重要的枢纽基因。
- 网络连接:网络图中的线条表示蛋白质之间的相互作用。枢纽基因通常有更多线条连接到其他节点,显示它们在网络中的中心位置。
- 生物学意义:
- 枢纽基因可能参与重要的生物学过程或通路。它们可能是疾病的关键治疗靶点,或者是理解复杂生物学现象的关键。
- 需要进一步的生物学验证和实验来确认这些枢纽基因的具体功能和作用机制。
MCODE找子网络
- 点击Apps菜单,选择MCODE来打开MCODE插件, 在MCODE插件界面中,选择“Find Cluster(s)”选项卡。
- 在“Find Cluster(s)”选项卡中,选择“in Whole Network”,然后点击“Analyze current network”按钮来分析整个网络并寻找子网络。
1. 分析完成后,MCODE会在左边面板中显示找到的子网络。你可以查看每个子网络的详细信息,包括节点数、边数和模块度(Module score)。
2. 如果你对某个子网络感兴趣,可以选择它,并通过点击“Create Sub-Network”按钮来创建一个新的子网络视图。
3. 可以通过“Export”按钮导出子网络,以便进一步分析或保存结果。
学习资料💾:
- 生新技能树数据挖掘课程——生信入门&数据挖掘线上直播课6月班
- 参考书籍📚——《R语言数据可视化与统计基础》