Py学习  »  机器学习算法

Nat Biomed Eng | 计剑/赵俊博/张鹏合作利用机器学习pipeline全文库挖掘抗菌肽

BioArt • 2 年前 • 455 次点击  

责编 | 兮


具有序列多样性的多肽分子构成了一个近乎无限的潜在药物储藏库。通过噬菌体展示、核糖体展示等高通量实验,最多可实现在107-1015数量级的序列库中进行筛选。抗菌多肽是应对耐药细菌感染的潜在手段。然而针对抗菌多肽,当前最先进的实验技术也仅实现了在80万序列文库中的筛选。

2023年1月12日,浙江大学计剑、赵俊博张鹏合作(共同一作为黄俊杰和徐彦超)Nature Biomedical Engineering上发表了文章Identification of potent antimicrobial peptides via a machine-learning pipeline that mines the entire space of peptide sequences报道了一个由经验判断、分类、排序和回归任务组成的全新机器学习pipeline(SMEP),实现在六肽-九肽全多肽序列文库(5000亿样本,27天)中挖掘强效抗菌肽,其中3条代表性的抗菌六肽表现出对多种临床分离耐药菌表现出了高杀菌活性,并且脱靶毒性低、不易诱导耐药性,在小鼠细菌性肺炎模型中表现出了良好的治疗效果。


1.SMEP概述

这项工作通过结合经验判断、分类模型、排序模型、回归模型、增量学习模型修正以及湿实验验证等步骤,探索建立了一种基于SMEP的抗菌肽快速识别方法(图1)。研究以六肽为模型肽进行识别任务,从具有6400万条多肽的六肽全库中识别抗菌肽。在识别工作实施前,作者借助文献数据分别训练分类模型、排序模型以及回归模型。

在识别工作中,作者首先借助经验判断(正电性;两亲性),生成符合条件的393万多肽子库。接着利用分类模型对393万肽库中的多肽进行分类,得到56万模型预测显示抗菌活性的多肽。然后使用排序模型对这些多肽的抗菌活性进行预排序,并挑选了前500条肽作为最终抗菌肽备选库。最后,使用回归模型对500条肽进行MIC预测,并挑选MIC预测值最低的10条肽(CRRI抗菌肽)进行湿实验验证。

图1 SMEP概述

2.各任务模型选择与消融研究

从数据库中获取7660个数据用于训练并测试分类、排序、回归模型。根据各模型的测试指标,确认XGBoost、XGBoost、LSTM分别执行分类、排序、回归任务。考虑到数据噪声问题,合成并测试了67个随机抗菌肽,并使用实验MIC值修正LSTM回归模型。执行SMPE后,获得top-10多肽并测试MIC。全部10条肽均具备抗菌性。而消融实验显示,删除SMPE中的任何模块都会严重影响pipeline预测能力,证明了SMPE设计的合理性。

3.SMPE泛化与抗菌肽体外测试

在未对SMPE进行任何修改的前提下,执行SMPE对七肽、八肽、九肽抗菌肽识别任务。图3a表明了SMPE极高的运算效率,仅需19天即可完成对九肽全文库共5120亿样本的抗菌肽识别任务。汇总六肽-九肽测试结果,识别的54条多肽(共55条)具有抗菌性,SMPE识别成功率高达98.2%。进一步测试了最具应用潜力的抗菌六肽的生物性能,证明了它们对包括临床分离的各类多药耐药菌具有抗菌活性,极低的脱靶细胞与血液毒性,且不易诱导细菌耐药性。

4.抗菌肽体内治疗测试

首先测试抗菌肽治疗短时间大量细菌感染急性肺炎的能力。采用中性粒细胞缺乏症小鼠建立细菌急性感染模型,再用雾化给药的方式进行治疗。经抗菌肽治疗后(CRRI3、4、7组),小鼠肺部细菌减少99.8%,且肺部损伤得到明显改善。类似的,作者还测试了抗菌肽应对更难以治疗的小鼠慢性肺炎的能力。结果显示,经抗菌肽治疗后小鼠肺部细菌减少了98.1%,且肺部损伤也得到明显改善,证明抗菌肽优异的体内治疗效果。

总之,本文创造性地整合经验判断、分类、排序、回归模型,并结合湿实验测试,完成对抗菌肽的高速(5120亿样本,27天)高精度(98.2%)识别任务。一举解决了算力不足与预测不准两大困扰机器学习应用的问题。其中分类-排序-回归任务的鲁棒性逐渐降低,预测精度逐渐升高。如此排列,一方面可以大幅节省回归模型算力,提高计算效率;另一方面,多尺度优化多肽备选库,提高模型预测准确度。可以认为,该项工作为分子大规模识别任务提供了一套完整的标准流程。

原文链接:

https://www.nature.com/articles/s41551-022-00991-2


制版人:十一


转载须知

【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/151680
 
455 次点击