Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >TBtools | Fasta格式与Table格式相互转化、Fasta文件拆分合并

TBtools | Fasta格式与Table格式相互转化、Fasta文件拆分合并

作者头像
生信real
发布于 2021-12-15 06:26:20
发布于 2021-12-15 06:26:20
7.7K00
代码可运行
举报
文章被收录于专栏:Linux基础入门Linux基础入门
运行总次数:0
代码可运行

本次介绍的是TBtools序列工具中的Fasta格式与Table格式相互转化以及Fasta文件的拆分与合并。进入TBtools界面,点击Sequence Toolkit进入Fasta Tools即可看到(如下图)。

首先介绍的是Fasta to Table Convert,该功能可以实现将Fasta格式的序列文件转换为Table格式,也可以将Table格式序列文件转换成Fasta格式。

演示文件①

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制


>Find00050.1
AAAGGTAATATATCTTCATTAAATATACAAAAAGGTACCTT
TTGGATGGAAAAGAAGTATATCTTGATAAGGGTATACTTCA
AGCGAATACGATCAAGGACTAAGAATTGTGAGTGTACCAAA
>Find00050.2
CATTAATTTCACTACATGAAAAGATTTTGCTGAGAAAAAGG
TTGGCTACCTCAAAAGTAGACTTGAAATTGAACATACTCGC
TCTTGGTTCACATCTTTTCTACTCTCATTTCCTATTCCTTG
>Find00050.3
TTTCCTCCGTTGTTATCGCTTCCGTTTGAAGATGCACCTGA
GCTGCTGAGCTTGATGATCCATTGTTACCATTATTTCCTCC
GAAGATGCACCTGAGGCTGCTGCGGCTGATGATGCTGCTG

操作步骤:如下图,可以选择以文件形式输出,或者点击图中黄色框中的[Output TextArea]直接输出在TBtools中。

输出结果:Fasta格式转换成Table格式

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Find00050.1    AAAGGTAATATATCTTCATTAAATATACAAAAAGGTACCTTTTGGATGGAAAAGAAGTATATCTTGATAAGGGTATACTTCAAGCGAATACGATCAAGGACTAAGAATTGTGAGTGTACCAAA
Find00050.2    CATTAATTTCACTACATGAAAAGATTTTGCTGAGAAAAAGGTTGGCTACCTCAAAAGTAGACTTGAAATTGAACATACTCGCTCTTGGTTCACATCTTTTCTACTCTCATTTCCTATTCCTTG
Find00050.3    TTTCCTCCGTTGTTATCGCTTCCGTTTGAAGATGCACCTGAGCTGCTGAGCTTGATGATCCATTGTTACCATTATTTCCTCCGAAGATGCACCTGAGGCTGCTGCGGCTGATGATGCTGCTGA

Tips:如果我们想把Table格式换成Fasta格式,只需要将TBtools中的转换方式调成[Table to Fasta]即可。

接下来介绍的是Fasta Merge and Split,该功能可以实现将多个Fasta文件合并成一个,或者将一个Fasta文件拆分成多个。

演示文件②

首先是Fasta合并,共三个Fasta文件:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
>test1
AATAAAGATCCAAGTAAGAAATATGATAAAATCGTAGAAGTTAAAAACTATTTGAGCTCG
ATAACAGAACGTCAAGTTCAAATTATCTCTCATGACACTGGAATTTTAGCTATAGTAGAA
TATGTGAAAGGTCTTAATGAAAGATGTGGAGGAGTATCTTTCTCTAATTATTTAAATGAA
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
>test2
TGTACGGATAAAAGCTTCATGGATTACGCTAAATCTGTTGTACCTTTTATATCCCCAGAT
TGCAACAATCGTACAACATGTAAGAATTTAACTTTTTCATCTGAACCTCTTATTCTTGCA
AATAATACGAGAGAAATGTCTGGAGCACTATATTACTCATCTGTACCTAATCAGTTTATA
GCAGCTAAGAATTATCCAGCAATTGTAGTTGTACCTAGTGGAGAAGTTGAACAAGTAGGT
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
>test3
TACCGCAATAGTGAAAACAATATTGGCGTACTAGATTTAAGAGATAAATCTGTAGTAGAT
TTTAAGATGAAACTCATGAACAACACCTTAGTACTACAGTATCAAGGTAATAATTTTGTA

操作步骤:

输出结果:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
>test1
AATAAAGATCCAAGTAAGAAATATGATAAAATCGTAGAAGTTAAAAACTATTTGAGCTCG
ATAACAGAACGTCAAGTTCAAATTATCTCTCATGACACTGGAATTTTAGCTATAGTAGAA
TATGTGAAAGGTCTTAATGAAAGATGTGGAGGAGTATCTTTCTCTAATTATTTAAATGAA
>test2
TGTACGGATAAAAGCTTCATGGATTACGCTAAATCTGTTGTACCTTTTATATCCCCAGAT
TGCAACAATCGTACAACATGTAAGAATTTAACTTTTTCATCTGAACCTCTTATTCTTGCA
AATAATACGAGAGAAATGTCTGGAGCACTATATTACTCATCTGTACCTAATCAGTTTATA
GCAGCTAAGAATTATCCAGCAATTGTAGTTGTACCTAGTGGAGAAGTTGAACAAGTAGGT
>test3
TACCGCAATAGTGAAAACAATATTGGCGTACTAGATTTAAGAGATAAATCTGTAGTAGAT
TTTAAGATGAAACTCATGAACAACACCTTAGTACTACAGTATCAAGGTAATAATTTTGTA

接下来是Fasta文件的拆分,以上面合并的文件为例。

具体步骤:

值得注意的是,下图拆分模式有三种,这里简单介绍一下。

①Record Per file:拆分后每个文件中含有序列数按照上方设置数来拆分。比如一个文件中共有'>'开头的序列12个,这里设置成3,则会拆分成4个文件,每个文件中含有3个序列。

②Number of File:按照设置数拆分成多少个文件,在这里演示拆分成3个文件;

③Size(KB) per file:按照每个文件3KB大小对原文件进行拆分。

输出结果:将原文件拆分成3个文件,每个文件含有1条序列。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-12-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信real 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Fasta序列文件合并与分割,支持.seq等无头序列
我隐约记得我写过类似主题,但也并不确定。相关功能,我并不写使用说明的冲动,一者是这些功能至少是四五年前就有的,二者是这些功能其实比较简单,但也并不常用。然而,现在我还是决定写一篇。主要动机简单,TBtools “黑转粉” 的人不多。而其中就有一个老铁直接找我聊过。说实话,我还是比较感动。毕竟愿意花时间去认识其他人的人,确实不多。而后来,这位老铁的不少建议,我都是接受的。其中有很多好建议,尽管我都放在todo list。但既然这次的需求简单,我觉得我有必要做个回应。
CJ-Chen
2021/05/09
1.6K0
TBtools | 获取基因代表序列、基因序列模式定位
本次介绍的是TBtools序列工具中的获取Fasta文件中的基因代表序列以及基因序列模式定位。进入TBtools界面,点击Sequence Toolkit进入Fasta Tools即可看到(如下图)。
生信real
2021/12/31
4K0
TBtools | 获取基因代表序列、基因序列模式定位
fasta格式文件介绍与处理
拼接完基因组之后最重要的事就是对拼接结果进行统计,一般很难一次就得到满意的结果。而是需要进行多次拼接,尝试不同的软件,不同的选项参数,得到多个拼接结果。然后从中选择一个合适的结果。这就需要对每个结果进行统计。包括拼接出基因组的大小,条数,最长长度,最短长度等。
生信喵实验柴
2022/05/23
3.8K0
fasta序列按指定格式输出
很多人应该遇到过需要将序列排列到一行上,或者每行按照规定的bp数显示。我也经常遇到像60bp,70bp的不等长fasta序列共存于同一个fasta文件中的情况,为了避免不同长度对后面的处理造成影响,一般最好将格式统一。
阿凡亮
2020/04/13
1.6K0
TBtools | 序列提取及过滤
本期讲解的是TBtools序列工具中的Fasta序列提取及过滤。进入TBtools界面,点击Sequence Toolkit进入Fasta Tools即可看到(如下图)。
生信real
2021/12/08
7.5K0
TBtools | 序列提取及过滤
Linux学习-文件排序和FASTA文件操作
环境变量的补充 PATH只是众多环境变量中的一个变量,用于存储可执行文件所在的目录,以便在用户输入命令时可以查询的到。尤其是自己写的脚本或安装的程序,系统不会知道它们在哪个路径下,需要我们去提供给系统这些新的路径,学名叫设置环境变量。 此外常用到的环境变量还有LD_LIBARY_PATH: 指定动态链接库 (so文件)的位置,一般在安装软件出错时会用到;PYTHONPATH: 指定Python的安装包的路径;PERL5LIB: 指定perl的安装包的路径。 设置环境变量要注意2点:1. 设置新的环境变量时一
生信宝典
2018/02/05
2.6K0
TBtools | 基因序列ID简化、重命名及添加前缀
你是否遇到过基因原始序列ID太长,包含太多不需要的信息,那么我们该如何对原始序列ID进行操作来加速我们的数据分析呢?
生信real
2021/12/08
17.8K0
TBtools | 基因序列ID简化、重命名及添加前缀
fasta/fastq文件处理的瑞士军刀-seqtk
上次在只用一行颠覆你处理文件的方式里面说了可以用Seqtk来处理fasta/fastq文件。那么这一期就来讲讲怎么来使用seqtk。
阿凡亮
2020/04/14
2.7K0
来一份Python学习题
3*2**2的输出是多少?(1分) 8 % 4的输出是多少?(1分) 32 + '32'的输出是什么?(1分) 32 > '32'的输出是什么?(1分) 'Sheng Xin Bao Dian'.find('x')和'Sheng Xin Bao Dian'.find('X')的输出分别是?(2分) 一句话计算'Sheng Xin Bao Dian'字符串中n的数目?(1分) 写出下面10段程序的输出?(1分/段) aList = [1, 2, 3] bList = aList bList.append(4)
生信宝典
2018/03/30
1.2K0
科研若要酷,就用TBtools!(收藏贴)
用我人生中第一张学术墙报开篇。一年前的这张墙报不能展示出当前TBtools的成长状态,但整体感觉还是可以不错(虽然没有获得任何奖项,毕竟参与会议的其他墙报都过分优秀。或许有一天,我们能做出更好的墙报)。
王诗翔呀
2020/07/06
5.1K0
科研若要酷,就用TBtools!(收藏贴)
Python学习教程(二)
输入输出 交互式输入输出 在很多时候,你会想要让你的程序与用户(可能是你自己)交互。你会从用户那里得到输入,然后打印一些结果。我们可以分别使用raw_input和print语句来完成这些功能。 a = raw_input("Please input a string\n> ") print "The string you typed in is: ", a Please input a string > a The string you typed in is: a print "这是一个保留例子,仅供
生信宝典
2018/02/05
1.5K0
Python学习教程(二)
为生信写的Python简明教程
给定FASTA格式的文件(test1.fa 和 test2.fa),写一个程序 cat.py 读入文件,并输出到屏幕 (2分)
生信宝典
2023/08/30
2860
为生信写的Python简明教程
相关推荐
Fasta序列文件合并与分割,支持.seq等无头序列
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验