秋分为半
秋分者,阴阳相半,数昼夜均而寒暑平
今日9时54分,迎来秋分节气。
秋分——古语阴阳相半,昼夜均长,寒暑平分。是一个非常公平公正的日子,也是一年中学习的最舒适的日子!所以势必要把“Python”的学习提上日程。争取逐步会使用一些简单的写法解决日常一些简单的小问题
主要参照学习的是生命科学与信息技术丛书系列的《Python生物信息学数据管理》一书,由意大利的Allegra Via, Anna Tramontano和德国的Kristian Rother著。翻译为中科院计算生物研究所的卢宏超等人负责。
对于这本书的学习我主要分享的是该书随附的课后练习,由于是学习的过程,代码可能写的比较蹩脚,希望得到大家的指正,因为当时书刚到的时候需要处理数据排序问题,所以就先看了本书的第八章——数据排序,所以现在将该章的课后练习第一题,及自己要解决的问题附录后面。
自测题8.1:编写一个程序,从文本文件中读取数据表(如下表所示),按第二列排序,将已经排好序的表的前三行写入新的文件
首先将该表命名为 protein_concertration.csv
排序需要用到python的内置函数sorted和operator模块
贴出代码如下
自己的问题 8.2 按序列长度(由长至短)对多序列fasta文件排序。提示:首先要解析在第4章中学到的文件并创建列表的列表,每行包含三个要素(标题、序列、序列长度)。然后根据子列表的第3个元素对列表排序,最后将已经排序列表写入文件
原文件如下,fasta序列
解决目的与方法
先将fasta文件的header和对应的seq合并成一个列表,以','分隔
接着计算seq碱基的长度,用到len()函数
将seq长度变量添加到之前列表的后面,构成三个元素的列表,贴出代码如下
转载是一种动力 分享是一种美德
领取专属 10元无门槛券
私享最新 技术干货