我们小编欢乐豆有个压箱底的 perl 脚本,由于编程语言"洁癖",想要彻底抛弃 perl 语言转向 python,于是他使用 AI 辅助下进行了转换,由于脚本相对简单,转换竟然就成功了。中间发现四种碱基含量百分比和原脚本统计有出入,检查确认是序列大小写没有注意的原因,修改后就完美运行了,这里分享给大家!
安装python模块
# 使用pip安装
pip install biopython
查看脚本参数
python N50Stat.py -h
usage: N50Stat.py [-h] -i INPUT_FILE [-o OUTPUT_FILE]
Calculate statistics for DNA sequences in FASTA format.
optional arguments:
-h, --help show this help message and exit
-i INPUT_FILE, --input_file INPUT_FILE
Input file containing DNA sequences in FASTA format.
-o OUTPUT_FILE, --output_file OUTPUT_FILE
Output file to store the statistics.
脚本获取方法
关注下方微信公众号【微因】,后台回复关键字【脚本】 (不含中括号哟),建议粘贴复制,避免出错,获取脚本与测试文件。
脚本输出结果
脚本输出结果如下:
代码解释说明
先来用 AI 对脚本进行下解释说明:
python script_name.py -i input.fasta -o output_statistics.txt
此脚本计算各种统计信息,如总序列数、总碱基数、最小和最大序列长度、平均和中位数序列长度,以及 N25、N50、N75、N90、N95 长度。此外,它计算每个核苷酸碱基的百分比,以及(A + T)和(G + C)的组合百分比。结果可以打印到控制台或保存到输出文件。怎么样,有没有用,要不要收藏或者用起来呀? 如果在学习过程中有什么疑问欢迎大家留言讨论。