我有数以千计的DNA序列,范围在100到5000 bp之间,我需要对指定对进行比对并计算身份得分。Biopython pairwise2做得很好,但只适用于短序列,当序列大小超过2kb时,即使使用了'score_only‘和'one_alignment_only’选项,它也会显示严重的内存泄漏,从而导致the scriptjob 4945543.1 died through signal XCP
我想用uniprot和pdb序列进行成对比对。我有一个包含uniprot和pdb I的输入文件,如下所示。pdb id uniprot id
1e43 P00692首先,我需要读取输入文件中的每一行2)从pdb.fasta和uniprot.fasta文件中检索pdb和uniprot序列3)进行比对并计算序列同一性。通常,我使用以下程序进行成对比对和seq.identity计算。您<