我有一组字符串,每个字符串的长度相同(10个字符),具有以下属性。集合的大小大约在5000到10,000字符串之间。数据集可以频繁变化。虽然每个字符串都是唯一的,但在大多数这些字符串中,都会出现一个特定模式的子字符串,而不一定位于相同的位置。Some examples are
123abc7gh0</e
我试图比较两个相等的字符串:一个textarea值(或textContent,或innerHTML)和一个存储在主干模型中的属性字符串,例如"A string↵with line break"。比较这些字符串的长度可以看出差异(存储的字符串长一个符号)。问题是如何准备第一个字符串(从textarea中提取),使其与第二个字符串
我希望我的序列有相同的长度,因此,填补空白(-)的较短的取决于我的fasta文件最长。简单地说,我认为实现这一目标的最好方法是找到最长的序列,然后给其他的序列增加空白,但可能有一个更快的选择。下面是我想要运行的脚本(但没有成功,因为它无法运行)。max_length=0
for sequence in SeqIO.parse(path/to/file, 'fasta&