本文将以在线的RAxML为例进行讲解:
测试数据及结果和相关处理软件已经上传至百度网盘:http://pan.baidu.com/s/1i5cPyXB密码:b23t
注:所有红色字体部分的结果都是本文测试数据所展示的结果
构建进化树的方法常见有:
Distance methods (距离法)
UPGMA (unweighted pair group method with arithmetic means)
Fitch-Margoliash
Neighbor-joining
Discrete character methods (独立元素法)
Parsimony
Maximum likelihood
下面将一步一步教大家进行系统发育树的构建
首先要用在线的MAFFT进行Alignment
值得一题的是此软件也是发在MEB上的一篇神文,多个版本历史被引用几万次,MAFFT第7版于2013年发表已经引用破5000;主页 https://mafft.cbrc.jp/alignment/software/,在各种系统的版本,适合所有人可用。
在线版地址:https://mafft.cbrc.jp/alignment/server/index.html
上传fasta序列文件到文本框中(All_Lentitheciaceae_LSU_sequence.fasta)
UPPERCASE / lowercase:选择 Same as input
Direction of nucleotide sequences: Help选择 Adjust direction according to the first sequence (accurate enough for most cases)
Output order:选择 Same as input
添写接收结果的邮箱,最后点击Submit
我们将邮件中的结果打开链接,选择fasta格式,复制新页面中内容粘贴至文本编辑器中另存为一个.fasta的文件(All_Lentitheciaceae_LSU_Aligned.fasta).
用Mesquite格式转换
这个软件解压之后可以直接点击运行(文件己存些百度云链接中,需要Java环境支持)
File—open file—选Fasta(All_Lentitheciaceae_LSU_Aligned.fasta)—OK—输出 .nex的文件(All_ALIGNED.nex)
然后选File—export—Phylip(DNA/RNA)—OK—参数选择序列最长字母数—导出.phylip格式的文件(All_ALIGNED.phy)。
PHYLIP介绍
PHYLIP是一个包含了大约30个程序的软件集,基本囊括了系统发育分析的所有方面,而且是免费软件,如上面提到的DNADIST和PROTDIST。根据谷歌学术检索,该软件目前已经被引用了3万次(3个常用版本),非常强大。其处理DNA序列的软件和处理蛋白质序列的软件不同:用最大节约法构建进化树时,DNA序列采用DNADIST软件,蛋白质采用PROTPARS软件;用距离法构建树时,DNA采用DNADIST软件,蛋白质采用PROTDIST软件;用最大似然法构建树时,DNA采用DNAML、DNAMLK,蛋白质采用PROTML或PROTMLK软件。
在线进行系统发育树构建:
进入ATGC网站 http://www.atgc-montpellier.fr/
我们选择左端Online programs,新页中选择PhyML,如下图
上传上一步得到的PHYLIP format文件(All_ALIGNED.phy)
选择建树模型:(如果前期得到了用Jmodeltest的树的模型可以在下列选项中选择一个模型),如果前期没有筛选模型选择GTR; Number of random starting tree: SPR
Tree Searching: 如果没有给定的树选择:BIONJ,no
Branch Support:Fast likelihood-based method:noPerform bootstrap:1000, yes
然后输入你任务的名字以及接收结果的email地址。
最后你就能把你的结果打包下载啦,这其中最有用的文件就是RAxML_bestTree.All_ALIGNED_result,这个树文件啦~
最后进行树的查看与编辑
可以用Figtree (免费软件)查看并编辑树的软件
树的编辑与美化都是依据个人喜好,大家可以用Figtree, Adobe Illustrator, Photoshop 等多种软件按自己的需求进行树的编辑与美化。
领取专属 10元无门槛券
私享最新 技术干货