在每一个基因的序列当中包含了很多基因特征性的信息,比如:[[SNP是什么东西?| 基因SNP信息]];DNA甲基化的CG信息或者[[转录因子调控]]的motif信息等等。但是如果只是查看基因序列的[[Fasta基因序列格式]]是看不出这些内容的。所以就需要一个综合性的查看基因序列特征的工具。这个时候就可以通过一个叫做「基因组浏览器」的东西来进行查看。之前我们介绍的[[WashU Epigenome Brower-表观基因组浏览器]]是一个用来查看表观遗传信息的基因浏览器,今天就介绍一个综合性的基因浏览器:UCSC Genome Browser Home: http://genome.ucsc.edu/index.html
一个经典的基因浏览器一般是长下面这个样子:
基因浏览器是一个查看基因组上综合性信息的内容工具。其中最基本的包括每一个基因不同转录本的外显子、内含子的具体位置情况。
在基因基本信息的基础上,可以添加其他额外的信息 (Track, 轨道) 来对基因信息进行注释,比如每一个基因的SNP信息或者说基因的甲基化位点的位置信息。在添加完之后,结合基因的位置信息就可以查看这个基因具体在哪个位置有SNP或者甲基化岛了。
UCSC Genome Browser 是以轨道为单位来展示不同基因组信息的。其中每一个轨道也可以设置展示信息的复杂性。在UCSC Genome Browser当中一共包括了5种不同的展示:hide、dense、squise、pack以及full。比如基因组信息的展示,不同的展示效果如下:
在轨道的右侧点击右键即可进行不同的设置
另外,每一个轨道内的信息,可以点击相对应的内容查看具体具体信息。比如CpG岛的位置。点击之后,就可以看到这个CpG岛的具体信息。
在Genome Browser当中经常会展示多个轨道的信息。在不同的轨道之间,可以通过拖拽的方式进行排序
UCSC Genome Browser主要分成两个主要部分,一部分就是上面介绍的可视化部分。另外一部分就是具体轨道添加部分。在Browser当中一共可以设置下面这些方面。
在Browser当中除了观察基因组内的基本信息 (SNP、突变或者甲基化岛等等)。另外也可以展示比如Chip-seq这类测序数据结合位点。在UCSC 当中集成了[[ENCODE-转录调控必知数据库]]数据库当中的测序数据。所以就可以展示里面的测序结果。
点击ENCODE Regulation可以设置要展示哪些ENCODE的数据。其中包括了传统的几个组蛋白修饰的数据以及DNase的数据。
如果要查看转录因子的话。可以点击TF Chip进行设置具体的转录因子。在这个里面有一个检测细胞系以及检测转录因子的表格。我们可以选择想要展示哪个转录因子的数据。比如:AGO2在HepG2细胞系中的数据。
关于Chip-seq的基本内容可以查看:[[chip-seq是个什么东东]]
选择好点击Submit就可以在图中看到这个转录因子和基因的哪个位置结合。比如👇图中就可以看到TP53基因多个位置和AGO2有结合。
以上就是关于UCSC Genome Browser的基本内容了。主要还是介绍了一下如何查看基因组浏览器以及在UCSC 怎么进行轨道的设定。其中只是以ENCODE数据距离。至于其他的限于篇幅的问题,就不一一说明了。
在研究一个基因之前,除了了解其之前的研究情况之外,也可以通过基因序列当中的一些固有信息来对这个基因进行探索。