DNA甲基化会调控基因的表达水平,进而影响基因的相互作用。将基因的相互作用网络和差异甲基化信息结合起来,基于那些甲基化水平发生差异的基因,从整个相互作用网络挖掘出这些基因的相互作用模块,这些模块可以看是与样本表型数据相关的基因集合,这种研究方式叫做, 也叫做。
在中,通过函数进行分析,用法如下:
> library(ChAMP)
> testDir=system.file(“extdata”,package=”ChAMPdata”)
> myLoad
> myNorm
> myEpiMod
基于两个输入数据:
PPI network 蛋白质相互作用网络
在中,蛋白质相互网络使用的是别人提供的数据集。 整个网络采用邻接矩阵的表示方式,网络中中每个节点是Entrez Gene ID。
> data(hprdAsigH)
> class(hprdAsigH.m)
[1] “matrix”
> str(hprdAsigH.m)
num [1:8434, 1:8434] 0 1 1 0 0 0 0 0 0 0 …
attr(*, “dimnames”)=List of 2
..$ : chr [1:8434] “1510” “10436” “7917” “4173” …
..$ : chr [1:8434] “1510” “10436” “7917” “4173” …
需要注意的是,这个数据集是在函数中直接定义的,也就是说在不修改源代码的情况下,我们只能基于这个数据集的PPI网络进行分析。
但是通常情况下,我们会从其他数据库中获取到基因的PPI网络,比如数据库,如果要基于数据库的PPI网络进行挖掘,就必须修改源代码了。
2. 差异甲基化信息
首先读取预处理之后的和分组信息,然后进行差异分析
PPI和甲基化差异信息准备好之后,就可以基于这两个数据进行分析。分析的结果是一个一个的, 每个看作是从整个PPI网络中提取出来的。
默认情况下,module的PDF格式的图片保存在工作目录下的下,同时还会生成和两个文件
目录下是所有的module 的PDF 图片
以第一个module 为例,
图中的每个节点是一个基因,其相互关系是PPI网络中定义好的,节点的颜色根据差异甲基化的T值定义,小于-1.5的为黄色到白色的渐变色,大于1.5为浅蓝色到蓝色的渐变色,中间的是灰色。
只提供了基于差异甲基化信息从PPI网络中挖掘核心module的功能,本值上是通过调用这个R包实现的,在这个R包中,还实现了基于基因水平的差异表达信息从PPI网络中挖掘核心module 的功能,具体的可以查看的帮助文档。
领取专属 10元无门槛券
私享最新 技术干货