我们在做基因组或者转录组数据分析的时候,经常需要用到染色体的长度。今天我们就来聊聊如何获取染色体的长度。我们以人的为例,给大家介绍两种不同的方法,都要用到著名的公共数据库UCSC(https://www.genome.ucsc.edu/)
方法一
1.在UCSC的主页上,点击Genomics,
2. 然后点击human图标,当然如果需要获取其他物种的染色体长度,这里就点击其他物种的图标
3.点击View sequences,你就会看到下面这张表
这张表拖到最底下,你会发现有Download as file,可以把这张表下载到本地
用文本编辑器打开如下,第一列是染色体号,第二列是每一条染色体的长度。大功告成了!
方法二
1. UCSC主页上点击Downloads->Genome Data
2.选择相应的物种,这里选择human
3.点击Genome sequence files and select annotations下面的Standard genome sequence files and select annotations
4. 下载hg38.chrom.sizes这个文件即可,跟上面一种方法得到的结果是一样的。