提到生信,不得不提NCBI
提到NCBI,不可不知blast
那么blast比对,你都会了吗?
今天小锐就跟大家讲讲
在线BLAST的使用方法与结果解释。
BLAST四分类
BLAST:Basic Local Alignment Search Tool,采用一种局部序列比对的算法分析两个序列中的相似区域,并计算统计显著性,包括:
Nucleotide BLAST
核酸序列到核酸库中的一种查询,库中存在的每条已知序列都将同所查序列作一对一的核酸序列比对。
Protein BLAST
蛋白序列到蛋白库中的一种查询,库中存在的每条已知序列将逐一地同每条所查序列作一对一的序列比对。
BLASTX
核酸序列到蛋白库中的一种查询,先将核酸序列翻译成蛋白序列,再对翻译成的每一条序列作一对一的蛋白序列比对。
TBLASTN
蛋白序列到核酸库的一种查询,与BLASTX相反,它是将库中的核酸序列翻译成蛋白质序列,再对所查序列作蛋白与蛋白的比对。
具体操作方法
首先进入NCBI在线BLAST网址:https://blast.ncbi.nlm.nih.gov/Blast.cgi
页面上有多种程序可选,我们将以最常见的Nucleotide BLAST为例进行操作讲解
1
进入blastn
2
输入查询序列
除了可以输入单条序列,还可以通过上传文件进行多条序列的比对。
3
设置比对参数
(根据需要,选择比对的数据库)
4
设置算法参数
5
点击blast运行
结果解释
1
比对基本情况
(输入序列类型,长度,比对数据库等)
2
比对结果图形显示
3
比对结果描述
一方面可以选择下载不同格式的比对结果,查看比对各参数分值;另一方面可以将所有比对结果序列根据距离构建进化树。
4
比对结果描述
详细结果中比较重要的参数包括
Score:序列比对过程中计算的得分值,得分越高,序列匹配结果越好。
Expect:表示随机匹配的可能性,e值越小,序列越相似,e值越大,随机匹配的可能性也越大。
Identities:序列相似性,匹配上的碱基数占总序列长的百分数。
Gaps:插入或缺失。
Strand:匹配方向。
预 告
为了解决大数据量的比对需求,Blast除了在线比对,还有local blast可以选择。
如何进行blast的本地化安装与使用呢?敬请期待小锐的后续讲解。
领取专属 10元无门槛券
私享最新 技术干货