大家好,本周分享的文章是发表在Cell子刊 Chem 上的Using Evolutionary Algorithms and Machine Learning to Explore Sequence Space for the Discovery of Antimicrobial Peptides,通讯作者是英国格拉斯哥大学化学系的 Leroy Cronin教授,课题组主要研究生物无机、纳米材料等方向。
抗菌肽(AMP)是一种前景广阔的抗生素类药物,但由于其存在大量可能的肽序列,新抗菌肽的发现和筛选一直很困难。传统的方法主要基于体外分子进化及虚拟筛选,另一种基于理性设计的方法,通过已知的AMP类似物来进行预测,这通常需要一个很大的原料肽数据库和复杂的参数调整。
本文的研究者采用的是具有实验表征反馈的遗传算法来优化筛选AMP。该方法使用具有肽序列的遗传算法作为“基因”,体外IC50测量结果作为“适应值”。这种方法允许从较小的起始文库中优化具有期望的生物或化学活性的分子。然而对于较长的肽段来说,遗传算法仍然对应着数量庞大的可能氨基酸组合,需要合成大量的多肽供筛选。因此在这篇文章中,作者加入了机器学习的策略,使用广义线性模型来调整肽序列位点上的氨基酸替代对“适应值”的影响,更新适应值矩阵。
三轮迭代之后,IC50值基本稳定,作者认为此时系统达到收敛。他们优化得到共44种高效肽,其中最优肽序列的IC50值比原来的序列对应的抗菌活性提高了160倍。进一步研究发现,得到的新序列的肽构象从无规卷曲变为α-helix结构。
这一策略测试了遗传算法在分子进化上的应用潜力,配合机器学习的线性回归方法,使用相对较少的实验对抗菌肽进行了筛选。
DOI:10.1016/j.chempr.2018.01.005
http://www.cell.com/chem/fulltext/S2451-9294(18)30027-5
领取专属 10元无门槛券
私享最新 技术干货