我有一个名为genbank.pm的Perl模块文件,它有一个子例程new;这个Perl模块没有使用Exporter,也没有定义@EXPORT或@EXPORT_OK。在同一个目录中,我有一个名为test.pl的Perl文件,test.pl的代码是:
require 'genbank.pm';
use strict;
our $result = genbank::new();
当我用Komodo运行它时,它报告:
Undefined subroutine &genbank::new called at /home/mrs/scripts/test.pl line 3;
在我
为了解析序列,我尝试将一堆.gbff基因库文件转换为.gbk。我有以下代码来工作和转换单个文件,
import Bio
from Bio import SeqIO
count = SeqIO.convert("filename.gbff", "genbank", "filename.gbk", "genbank")
但是,我不能让任何代码与"*.gbff“工作。例如。
from Bio import SeqIO
count = SeqIO.convert("*.gbff", "genbank"
我不知道我是否能很好地面对这个问题。我有一个带有标识的文件,然后有10个文件,其中一些标识带有数据库名称(每个Id相同,但文件之间不同)。我尝试做的是将这10个文件的所有I与只有标识的文件进行匹配,除非之前已经匹配了标识。
这10个文件如下所示:
File 1:
Id Data Data Data Database_name
Id1 ... ... ... GenBank
...
Id20 ... ... ... GenBank
File 2:
Id Data Data Data Database_name
Id2 ... ... ...
我有一个充满登录号的数组,我想知道是否有一种方法可以使用BioPerl自动保存genbank文件。我知道你可以抓取序列信息但我想要整个GenBank记录。
#!/usr/bin/env perl
use strict;
use warnings;
use Bio::DB::GenBank;
my @accession;
open (REFINED, "./refine.txt") || die "Could not open: $!";
while(<REFINED>){
if(/^(\D+)\|(.*?)\|/){
push(@
我正在处理一些genbank文件,并有以下代码:
for seq_record in SeqIO.parse("datafile_location, "genbank"):
虽然它可以通过seq文件中的大多数seqs运行(其中包含多个seqs),但我得到以下错误。对如何解决这个问题有什么想法吗?
也许会删除冒犯的seq?它可以记录92126 of 93145,然后抛出错误。
我试过重新下载seq文件,但这并不能解决问题。
文件"C:\python38\lib\site-packages\Bio\GenBank\Scanner.py",第516行,在pa
我正在使用BioPython遍历GenBank文件中的开放阅读框。更具体地说,我考虑了在GenBank中标注为“CDS”的特性。所以我的代码是这样的:
from Bio import SeqIO
gbk_dat = SeqIO.read(genbank_filepath, 'genbank')
for feature in gbk_dat.features:
if feature.type == 'CDS':
# Identify coding frame
我想知道是否有可能确定一个基因相对于整个基因组在哪个编码框架中?即。如果一个基
可以为CDS特征输出基因位置吗?或者我需要自己解析' location‘或'complement’字段吗?
例如,
seq = Sequence.read(genbank_fp, format='genbank')
for feature in seq.metadata['FEATURES']:
if feature['type_'] == 'CDS':
if 'location' in feature:
print 'location = &
这里我写了一个代码,用"id“来提取基因的"locus_tag”。如何将输出结果以制表符分隔的格式保存到文件中?代码采用并修改了
from Bio import SeqIO
foo = open("geneid.txt")
lines = foo.read().splitlines()
genbank_file = open("example.gbk")
for record in SeqIO.parse(genbank_file, "genbank"):
for f in record.features:
我有一个mongodb和一个名为genbank的数据库。Genbank的用户角色是"read“和"readAnyDatabase”。非常奇怪的是,我不能通过MongoVUE通过这个角色连接到genbank,但是我可以在管理员角色下成功地连接。
连接配置是:
📷
genbankReader是genbank数据库的用户名。
错误信息是:
Unable to connect to server *.*.*.*:40000: Invalid credential for database 'admin'..
Type: MongoDB.Driver.MongoConne
我有一个大约3 GB的Genbank文件,其中包含大约20,000个细菌基因组序列的完整Genbank注释。我的目标是使用BioPython解析这些序列,并为非重复序列编写单独的fasta文件,如下所示: from Bio import SeqIO
records = SeqIO.parse(r'C:\Users\aaa\aaa\file.gb', 'genbank')
for record in records:
if seq_name not in organism_dict:
with open(output_folder + s
我对Java非常陌生,我想要构建一个可以将GenBank文本文件转换成FASTA格式的程序。基本上有两个文本框:一个是我上传GenBank格式文件的地方,另一个是显示转换后的FASTA格式文件的文本框。
这是一个GenBank格式文件:
LOCUS AB000263 368 bp mRNA linear PRI 05-FEB-1999
DEFINITION Homo sapiens mRNA for prepro cortistatin like peptide, complete
cds.
ACCESSIO
我有一个文件,其内容如下:
NC_014378.1 Protein Homology CDS 192004 192117 . + 0 ID=cds185;Parent=gene211;Dbxref=Genbank:WP_013277182.1;Name=WP_013277182.1;gbkey=CDS;inference=COORDINATES: similar to AA sequence:RefSeq:WP_005487032.1;product=50S ribosomal protein L36;protein_id=WP_013277182.1;transl_ta
我正在制作一个闪亮的应用程序,我在其中生成一个文件,其中包含用户所指示的有机体的DNA序列。该文件是立即创建的,但直到几秒钟后才被填充,而R转到下一个命令。应用程序停止,因为下一个命令需要这个文件,并发现它是空的(因为它仍然在生成)。我可以放什么命令使R等待文件满了?或者等几秒钟。
守则是:
# LIBRARIES
library(shiny)
library(dplyr)
library(pr2database)
library(Biostrings) # To save fasta files
library(base)
library(treeio) # tree manipulatio
我是Python的新用户,我尝试导入genbank和fasta格式的文件。在他们的文档中,他们提供了一个示例,说明如何将数据集导入到Python中。具体地说,他们在Biopython教程和Cookbook的第16页中提供了以下示例:
from Bio import SeqIO
for seq_record in SeqIO.parse("ls_orchid.gbk", "genbank"):
print seq_record.id
print repr(seq_record.seq)
print len(seq_re
我的脚本的主要目标是将genbank文件转换为gtf文件。我的问题是从codon_start所有 CDS条目中提取CDS信息(基因、位置(例如CDS 2598105..2598404)、protein_id、db_xref)。我的脚本应该打开/解析一个genbank文件,从每个CDS条目中提取信息,并将信息写入另一个文件。脚本不会产生错误,但在终止之前只会从genbank文件的前1/2写入信息。这是我的密码。
import Bio
from Bio import GenBank
from Bio import SeqIO
fileList = ['data_files/e_coli_
我用Python编写了以下程序:
import re
import os
import string
folder = 'C:\Users\Jodie\Documents\Uni\Final Year Project\All Data'
folderlisting = os.listdir(folder)
for eachfolder in folderlisting:
print eachfolder
if os.path.isdir(folder + '\\' + eachfolder):
filelisting = os