世上本没有套路,用的人多了,便成了套路。
今天介绍一篇circRNA生信文章,对于参加过我们数据挖掘相关培训班的童鞋来说,这些分析大多是比较熟悉的。
文章发表在《Cancer Cell International》上,杂志最新影响因子3.439。本文通过分析公共数据库中胃癌相关数据,构建了circRNA相关的ceRNA网络。
一、筛选差异表达circRNA,miRNA以及mRNA
本文从GEO数据库中选取了4个相关数据集,
分别做了差异表达分析,然后进行整合排序,选择前8的circRNA(DEcircRNAs)作为进行进一步的分析,这里在整合排序的时候用到了一个包"RobustRankAggreg",可以整合不同数据集的差异表达结果,做芯片的meta分析,有兴趣的童鞋可以去研究一下。
另外一方面,文章从TCGA的数据中筛选胃癌差异mRNA(DEmRNAs)以及差异miRNA(DEmiRNAs),用于与后面预测的靶点取交集。
二、靶点预测与ceRNA网络构建
首先,预测上述8个DEcircRNAs靶向的miRNA,用到的数据库为CSCD和
CircInteractome,然后用预测的miRNA与DEmiRNAs取交集,用于后续分析。
随后,用上述得到的交集DEmiRNAs预测mRNA靶点,用到的是TargetScan、miRTarBase、miRDB三个数据库,再将预测到的mRNA与DEmRNA取交集。
最后,运用上述得到的circRNA, miRNA, mRNA,构建ceRNA网络。
三、分子功能分析
接下来就是常规操作,对ceRNA网络中的mRNA先进行GO和kEGG通路富集,
再做个PPI网络,找到hub基因。
这篇文章的大致内容就是这样,这里需要指出的是,circRNA的数据来源于GEO,这是因为TCGA里面目前还没有circRNA的数据,但是mRNA和miRNA的数据还是有的(lncRNA也有),所以,文章联合了这两个数据进行分析。
领取专属 10元无门槛券
私享最新 技术干货