今天是生信星球陪你的第83天
你想找辆共享单车,发现满街都是别家车,没有一辆你能骑。
你想学点生信,搜了“初学者教程”,满眼尽是高大上,没有一句能看懂。
终于你跨越茫茫宇宙,来到生信星球,发现了初学者的新大陆!
由于测试数据还没有到位,所以将分成今明两部分展示IGV
.你会用到的网站:
IGV 官网http://software.broadinstitute.org/software/igv/download~ Broadinstitute出品
Java version8 下载: https://www.java.com/en/download/mac_download.jsp
IGV内置的物种基因组及基因组来源:http://software.broadinstitute.org/software/igv/Genomes
完整的官方帮助文档:http://software.broadinstitute.org/software/igv/book/export/html/6
.写在前面:
之前mac不小心升级了一下java,然后igv就不能用了,要写教程必须降级java
首先,看官方说明,需要安装Java -8,9以上版本不支持。我的mac不知道什么时候更新到了java 10,按说可以向下兼容,但是事与愿违,igv不能正常使用了。
需要降级Java,mac用户可以直接参考,windows可以试下直接下载安装IGV:
先删除原来的java
sudo rm -fr /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin
sudo rm -fr /Library/PreferencesPanes/JavaControlPanel.prefPane
sudo rm -fr ~/Library/Application\ Support/Java
⚠️:不要通过/usr/bin 删除 Java 工具来卸载 Java。此目录是系统软件的一部分,下次对操作系统执行更新时,Apple 会重置所有更改。
中进入 ,然后删除之前的jdk.版本号
打开终端,复制粘贴一下三条命令:
下载安装新的Java version8
https://www.java.com/en/download/mac_download.jsp一步步安装就好
【Windows用户下载,解压后,点击igv.bat文件即可启动;如果启动失败,用记事本打开并编辑igv.bat文件,在文件的最后新起一行输入pause,保存后,再尝试打开,就可以在Windows下的命令行界面(cmd命令提示符)看到错误信息,再根据信息提示去解决问题;不过一般问题不大】
.正文开始:
好啦,问题解决啦,开始正式IGV介绍!
什么是IGV
它是一款本地的探索基因组数据的可视化浏览器,有多个系统版本,支持多种不同类型的输入格式,包括芯片测序、二代测序、基因组注释文件等。推荐使用BAM与SAM格式,主要格式见下表
一睹IGV
每次打开会自动加载hg19.fa文件,也就是人类基因组,一会进入主界面
自己构建基因组信息
如果研究的物种没在上面的列表中找不到,就需要自己构建基因组信息,物种基因组在NCBI中的下载地址:ftp://ftp.ncbi.nlm.nih.gov/genomes/。下完基因组再顺便下载下来GFF或者GTF注释文件
这里我会举一个昆虫中一种——棉铃虫,这个基因组是17年2月更新在NCBI伤的,属于小众物种,IGV并没有收录。正好拿来练手,当然如果你研究的领域也有基因组被测出来,也可以试一试【注意:在提交基因组文件到IGV之前,要先构建索引】
这些工作都可以在本地进行,只需要打开你本地的git_bash或者putty/xshell或者terminal,解压缩基因组文件=》下载samtools(推荐用conda管理)=>构建索引=>IGV中 输入fasta文件路径=》提供注释文件(可以是组装基因组预测的基因注释文件,也可以是拼接转录组用的gtf文件)=〉其他选项可以忽略=》点击OK推弹出一个框让你输入存储路径
查看注释文件
这里以人类基因组注释文件为例,下载gtf到电脑
下载完不要急着导入,需要先构建索引
然后会生成gff3.idx或者gtf.idx文件,说明构建了索引,接着导入 ,选择sorted的注释文件
【明日预告】查看bam文件
这个练习数据获得很简单,有参考基因组,有测序数据就行:先把参考基因组用bwa index构建参考基因组索引,然后把测序数据用bwa mem比对到参考基因组得到sam格式,最后用samtools转换格式sam to bam
领取专属 10元无门槛券
私享最新 技术干货