首页
学习
活动
专区
圈层
工具
发布

脚本分享—快速统计基因组组装结果

我们小编欢乐豆有个压箱底的 perl 脚本,由于编程语言"洁癖",想要彻底抛弃 perl 语言转向 python,于是他使用 AI 辅助下进行了转换,由于脚本相对简单,转换竟然就成功了。...安装python模块 # 使用pip安装 pip install biopython 查看脚本参数 python N50Stat.py -h usage: N50Stat.py [-h] -i INPUT_FILE...函数: calc_n50(seq_lengths, percentile):计算给定序列长度列表和指定百分位数的 N50 长度。calc_median(arr):计算给定列表的中位数。...例如,要运行脚本:python script_name.py -i input.fasta -o output_statistics.txt此脚本计算各种统计信息,如总序列数、总碱基数、最小和最大序列长度...、平均和中位数序列长度,以及 N25、N50、N75、N90、N95 长度。

54310
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    测序数据拼接,首先需要了解这些概念!

    ,scaffold N50达到20Kb,单碱基错误率在十万分之一以下,一般采用小片段文库使用二代测序Hiseq完成。...精细图:指经生物信息学分析后,拼接得到的基因组覆盖度大于98%,基因区覆盖度达到99%以上,contig N50达到20Kb,scaffold N50达到300Kb,单碱基错误率低于十万分之一,gap数不超过...基于这些序列,可以确定一些Contig之间的顺序关系,这些先后顺序已知的Contigs组成Scaffold,如下图所示: N50:Reads拼接后会获得一些不同长度的Contigs。...将Contigs按照这个顺序依次相加,当相加的长度达到Contig总长度的一半时,最后一个加上的Contig长度即为Contig N50,可以作为基因组拼接的结果好坏的一个判断标准。...此概念很容易被误认为所有Contigs长度排名第50的序列长度,与之类似的有N90,N50与N90同样适用于Scaffolds。

    2.4K20
    领券