Py学习  »  机器学习算法

Nat Commun | 张勇/刘聪合作开发机器学习方法预测不含内在无序区域的相分离蛋白

BioArtMED • 1 月前 • 36 次点击  
近年来的研究发现相分离形成的无膜细胞器在大量的生命活动中发挥着重要作用。相分离蛋白之间形成的多价非共价相互作用主要通过两种方式实现:一种是通过内在无序区域(intrinsically disordered region,IDR之间的相互作用,另一种是通过模块结构域之间的相互作用。鉴于已知结构的蛋白质数量有限,现有的相分离蛋白预测方法只利用了蛋白质的序列特征,没有整合模块结构域的结构特征,预测结果强烈偏好于含有IDR的蛋白,对于不含IDR的相分离蛋白预测效果不佳。

近日,同济大学生命科学与技术学院张勇课题组与中国科学院上海有机化学研究所刘聪课题组合作在Nature Communications上发表了题为Machine learning predictor PSPire screens for phase-separating proteins lacking intrinsically disordered regions的文章,开发了预测不含有IDR的相分离蛋白的机器学习方法PSPire。


张勇课题组开发了PSPire方法:首先使用训练数据集中蛋白质的AlphaFold预测结构作为输入,计算了这些蛋白质的序列和结构特征,并利用这些特征训练了一个XGBoost分类器。PSPire通过整合蛋白质的序列和结构特征,能够高效筛选不含IDR的相分离蛋白。在多个数据集上的评估表明,相较于现有的相分离蛋白预测工具,PSPire对于不含IDR的相分离蛋白质预测的准确性有了极大的提升,进一步证实了蛋白质结构信息在解码相分离过程中涉及的多价相互作用的重要性。刘聪课题组实验验证了PSPire的预测能力,测试的11个候选相分离蛋白中有9个被证实能够在细胞内发生相分离。


同济大学张勇教授和中国科学院上海有机化学研究所刘聪研究员为该论文的共同通讯作者,同济大学研究生侯爽和中国科学院上海有机化学研究所研究生胡姣姣为共同第一作者。

文章链接:https://doi.org/10.1038/s41467-024-46445-y

制版人:十一



转载须知


【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。





BioArt

Med

Plants

人才招聘

会议资讯



近期直播推荐



Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/168002
 
36 次点击