腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
根据
带
间隙
的
id
替换
FASTA
序列
、
、
、
我在一个文件中有2000个
fasta
序列
,如下所示: >T1 -----
浏览 18
提问于2020-04-22
得票数 1
3
回答
如何从BLAST输出中获得未映射
的
序列
?
、
、
、
我感兴趣
的
是从
FASTA
格式
的
BLAST输出中获得未映射
的
序列
。我认为我可以使用hsps_no_gap,但它不起作用。有没有什么方法可以让我完成这件事?
浏览 0
提问于2011-09-15
得票数 1
1
回答
如何从python中
的
列表中删除字符
、
我从
fasta
文件中创建了一个
序列
名称和
序列
列表。有谁知道我怎样才能从
序列
名称列表中删除can >‘>字符?我试过用
带
,
替换
,地图。该列表提供了以下输出:>chrII在应在
的
地方:chrIIfp = open(r'demo_
fasta
_file_2022.fas', 'r') def read_
fasta
(
浏览 2
提问于2022-03-11
得票数 1
回答已采纳
1
回答
在循环中连接
fasta
文件
、
我有多个具有相同长度
序列
的
多个人
的
fasta
文件。我想做
的
是沿着
fasta
文件创建物种
序列
的
串联。在循环中:如果在下一个文件中发现一个物种,我连接它
的
序列
,如果没有,我连接
间隙
('-'),与其余
序列
具有相同
的
长度。') species_list
浏览 11
提问于2018-01-24
得票数 0
回答已采纳
2
回答
大型多线程上
的
python中
的
多线程
、
、
、
我
的
问题很简单,但我想不出怎么解决它。我有一个大约一百万个
序列
的
列表,每个
序列
都需要与测序适配器进行比对。我正在考虑在python中使用Biopython中
的
pairwise2工具进行对齐。我想使用这个工具,因为我需要收集所有的比对分数,做一些数学运算,并
根据
数学运算选择
序列
。如果我运行下面的代码,它可以工作,但速度很慢,因为每次只运行一次对齐。+ " " + record.seq + " " + adapter.
浏览 16
提问于2017-03-14
得票数 0
2
回答
从
fasta
提取多个不同名称
的
序列
、
我正在尝试
根据
ID
列表从
fasta
文件中提取
序列
子集,到目前为止还不错。我
的
问题是我
的
ID
列表包含额外
的
第二列(它表示
序列
的
编码部分),我希望将它保存在新
的
fasta
文件中。from Bio import SeqIOfor line in open("test.txt","r"):
id</
浏览 4
提问于2014-02-01
得票数 1
回答已采纳
1
回答
循环两个
FASTA
文件中
的
ids
、
、
、
>3对于每个
fasta
文件,我也有一个
ID
列表,我想用这些
ID
来提取特定
的
序列
,创建一个2
序列
fasta
,然后执行一些操作(对齐,计算距离)。列表:1cat file2.list1 我正在尝试循环列表中
的
每一行,以提取与特定
id
/行匹配
的
浏览 3
提问于2017-02-20
得票数 1
1
回答
如何在两个非常大
的
fasta
文件中找到同名
的
序列
,并用
间隙
将它们连接起来?
、
、
我有两个非常大
的
fasta
文件,都在2 2GB左右。它们有一些
序列
具有相同
的
名称,因此如下所示:">ABC001 ACTGTGTCGTG">ABC005 ACTGTGTCGTG">ABC002 ACTGTGTCGTG">ABC005 ACTGTGTCGTG "&g
浏览 2
提问于2013-05-02
得票数 1
1
回答
替换
dna
序列
文件中某一位置
的
核苷酸
、
我有一个
fasta
文件,另一个文件包含位置,我想用默认设置
替换
每个
序列
的
某个位置,例如,我
的
位置文件看起来像a/c 120,我
的
替换
表看起来像a/c到W,所以我想得到一个新
的
fasta
文件,位置120用w
替换
。该程序是用Python编写
的
所以第一个问题是我不能到达正确
的
位置,例如,如果我使用my_seq_
id
0:3,我就得到了
序列</
浏览 0
提问于2014-05-15
得票数 0
2
回答
Grep输出添加额外
的
破折号和换行符。
无论如何,我正在尝试使用grep查询
fasta
文件(DNA
序列
-一行
的
DNA
序列
ID
和下面一行
的
DNA
序列
),以便
根据
要查询
的
字符串文件列表输出文件
的
子集。目前,我有一个列表,它是在换行符和
fasta
文件上分隔
的
单个单词,正在使用以下命令 grep -A1 -f query_list.txt initial_file.
fasta
> query_subset
浏览 0
提问于2014-09-08
得票数 4
回答已采纳
1
回答
字母串
的
计数长度
、
我有一个类似的文件(
fasta
格式
的
DNA
序列
):ATCGTGATNNNNNNNNAGTCGATCGGATTCTNNNNATGTNNATGTCCNNNNNNN我想数一下缺口
的
长度,也就是N个字符串
的
长度。例如,在第一个
序列
中,长度为8。在第二个
序列
中,我
的
间隙
为4,另一个为2,另一个为7。如果我能得到一个具有
间隙
长度密度
的</e
浏览 0
提问于2014-03-04
得票数 0
1
回答
如何
根据
序列
id
组合
FASTA
序列
?
、
、
我有9个
FASTA
文件,代表了9个基因
的
DNA
序列
。>1>16>2...>2>34>1...我想把这9个基因
FASTA
文件转
浏览 0
提问于2018-09-29
得票数 1
回答已采纳
1
回答
按列表文件顺序提取
fasta
序列
、
、
我需要从"goodProteins.
fasta
“文件(第一个输入)中提取一些
fasta
序列
,其中
id
列表文件位于单独
的
文件夹中(第二个输入)。
fasta
序列
文件
的
格式是:FSKVJLKDFJFDAKJQWERTYU......SKJFHKDAJHLQWERTYGFDFHU......1_12258 1_1
浏览 2
提问于2015-02-02
得票数 1
回答已采纳
2
回答
FASTA
算法解释
、
我试图了解
FASTA
算法在数据库中搜索类似查询
序列
的
基本步骤。算法
的
步骤如下:我混淆了使用PAM250分数矩阵
的
第3和第4步,以及如何“加入使用空白”。
浏览 5
提问于2011-12-03
得票数 7
1
回答
不等字符串长度
的
多
序列
对齐
、
、
、
、
我需要一个方法来创建一个一致
的
序列
3-1000短(10-20 10)核苷酸("ATCG")读取
的
不同长度。一个简化
的
例子:"AGGGC""AGGAGC"应该会产生一个一致
的
"AGGGGC"
序列
。我在BioPython库中找到了进行多
序列
比对(MSA)
的
模
浏览 4
提问于2015-07-01
得票数 4
回答已采纳
1
回答
使用BioPython将
FASTA
seq_
ID
替换
为来自dict
的
新
ID
、
、
、
、
我有一个很大
的
文件,里面有很多
FASTA
序列
。其中一些需要重命名--我正在尝试将
FASTA
序列
ID
替换
为它们
的
更新版本。我将信息存储在字典中,这样旧
ID
就是键,新
ID
就是值。无论我做什么,我似乎既不能
替换
I,也不能正确地写一个新
的
fasta
文件。我正在使用SeqIO读取我
的
fasta
文件。下面是我
的
一些代码:
浏览 1
提问于2018-08-14
得票数 0
回答已采纳
1
回答
重叠记分矩阵生物工程
、
、
、
我有一个包含DNA
序列
和
序列
名称
的
FASTA
文件,我需要建立一个重叠分数
的
矩阵。我在Biopython中找到了模块pairwise2,它似乎做得很好。除了我
的
序列
已经对齐,当我使用pairwise2时,它再次尝试对齐
序列
,这花费了很长
的
时间,显然每次对齐都得到相同
的
重叠分数。因此,我
的
问题是,如何获得重叠评分,而不试图再次对齐
序列
?= SeqIO.parse('unamb
浏览 4
提问于2017-01-10
得票数 3
回答已采纳
1
回答
使用每个文件中第一个
序列
的
ID
自动重命名
fasta
文件
、
、
、
、
我在同一个目录中有多个
fasta
文件,其中只有一个
序列
。我想用
fasta
文件中存在
的
单个
序列
的
标题重命名每个
fasta
文件。当我运行我
的
代码时,我得到了“
替换
模式没有终止于(用户提供
的
代码)” 我
的
代码: #!/bin/bash do if [ !.*$/\1
浏览 42
提问于2019-01-08
得票数 0
1
回答
间隙
编码为'N‘,多态为歧义
的
BioPython共识
序列
、
、
、
我正在尝试编写代码,以获得文件夹中各个
fasta
对齐
的
每个100+文件
的
一致
序列
。一开始,我只想获得一个
序列
的
共识(然后我将使用for循环来处理所有
序列
),但我在共识
的
字母表中遇到了麻烦。我
的
测试
fasta
对齐方式是:ACGTACGATCGTTACTCCTAACGTACGA---TTACTCGTAACGTACGANNNTTACTCSTA
浏览 4
提问于2013-05-01
得票数 1
3
回答
ReformAlign可执行文件不稳定。
、
有没有什么我做不到或者应该做
的
事情才能正常工作。任何建议和帮助都是非常感谢
的
。
浏览 0
提问于2017-11-17
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
序列提取-《-零命令行-生信下游数据分析》-第一弹
生信日常编程-从fa文件批量根据id列表提取序列
Perl的学习继续
SeqKit-FASTA/Q序列处理神器
批量下载NCBI数据的利器——Entrez Direct
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券