ID转换
首先我们需要下载Ensembl ID和基因名的数据库,这里推荐依然是Ensembl ID官网,毕竟有些软件使用的数据库太老了,没有及时更新。如下图,百度的第一个选项。
第二步 解压
下载完成后解压,会得到一个大约一两个G的数据库文件,里面有所有人类基因的Ensembl ID和symbol的对应关系。
第三步 文件准备
基因矩阵文件、数据库文件、以及Convert_ID.perl脚本(分别对应下方三个文件)放入同一文件夹,在命令行输入perl Convert_ID.perl Homo...文件名 +需要生成的文件名.txt,运行脚本就可以生成第一列为GeneID|EnsemblID|RNA类型的矩阵文件。
out.txt即为生成的文件
提取lncRNA
此时不想编代码的朋友可以直接使用excel进行筛选即可。
第一步:将第一列分为三列
如上图,以第三列为筛选对象,这里就可以得到你需要的数据了。
代码获取联系后台小哥哥即可。
关注我们
领取专属 10元无门槛券
私享最新 技术干货