Py学习  »  机器学习算法

Nature Machine Intelligence | 曾坚阳/赵诞提出基于深度学习的T细胞受体和抗原表位相互作用的预测模型

BioArtMED • 1 年前 • 158 次点击  
T细胞受体和抗原表位的相互作用是启动机体免疫的重要环节,这种相互作用可以激活T细胞,从而识别并攻击感染机体的病原体,例如细菌、病毒或肿瘤细胞。当T细胞受体和特定抗原表位结合时,会激活一系列信号传递通路,从而促使T细胞增殖并释放各种细胞因子。因此,研究T细胞受体和抗原表位的相互作用以及两者的关键结合位点是理解机体免疫系统如何工作的关键。

2023年3月27日,清华大学交叉信息研究院的曾坚阳/赵诞研究组在Nature Machine Intelligence发表文章Characterizing the interaction conformation between T cell receptors and epitopes with deep learning成功开发了能预测T细胞受体和抗原表位相互作用的深度学习模型,通过建模和预测T细胞受体和抗原表位的相互作用以及氨基酸层面的关键互作位点,为揭示T细胞受体和抗原表位的结合规律和机制提供了有效工具。除此之外,作者还展示了模型的三种潜在应用:捕捉和预测突变引起的TCR-epitope相互作用的构象变化,对特定抗原表位的TCR组库计算关键结合位点,以及挖掘TCR-epitope相互作用的潜在规律。


T细胞在适应性免疫反应中对抗原表位的识别至关重要。这种识别通过主要组织相容性复合体(MHC)呈递的致病抗原(epitope)与T细胞受体(TCR)相互作用来实现,随后刺激细胞介导的免疫反应,进而消除被感染细胞并激活相应的免疫反应。因此,深入了解TCR-epitope的结合机制对于癌症免疫学、自身免疫抗原发现和疫苗设计具有重要意义。然而,由于这种识别机制的内在复杂性,TCR与epitope的相互作用往往依赖实验,如表面等离子共振(SPR)、酶联免疫吸附(ELISA)、细胞荧光免疫分析(IFA)或细胞流式分析等方法进行检测和验证,通常既费时又昂贵。

为了解决这一问题,来自清华大学交叉信息研究院的曾坚阳/赵诞团队开发了TEIM模型,通过小样本学习(Few-shot learning)的思想来准确预测TCR-epitope在氨基酸水平的相互作用和结合信息。模型首先在粗粒度的TCR-epitope序列结合信息上进行预训练,然后在细粒度的残基相互作用信息上进行进一步微调。其基本的设计思想是,TCR与表位的整体相互作用是由所有氨基酸的相互作用共同决定的,因此作者借助卷积神经网络的卷积核的特性,利用体外结合实验提供的结合信息帮助预测两者在氨基酸层面上的相互作用。测试和分析结果表明,TEIM模型具有优良的预测性能,准确度超过现有其他方法。随后,作者在三个具体的应用场景中展示了模型的效果。首先,作者将模型应用在突变序列上,从而预测出TCR或表位序列上的突变对两者结合的影响;其次,作者利用模型分析特定表位的TCR库,从而获得结合该表位的特征模式;最后,作者通过预测模型揭示了TCR和抗原表位互作面上的一些常见的规律模式和结合机制。该研究首次使用深度学习框架建模多层级的T细胞受体和抗原表位的相互作用,并且融合了大规模预训练思想和少样本学习策略,为阐明T细胞识别抗原表位这一重要的生命科学问题提供了有力工具。

图1. TEIM模型结构和评估效果 (a) TEIM-Seq 和 TEIM-Res 的模型结构以及训练流程。(b-e) TEIM-Res 和其它基线方法相比。


该论文通讯作者为清华大学交叉信息研究院的曾坚阳副教授和赵诞助理研究员,第一作者为清华大学交叉信息研究院硕士毕业生彭鑫港(现为北京大学智能学院和北京大学人工智能研究院博士生)和博士研究生雷逸品。

曾坚阳课题组长期致力于人工智能/机器学习和生命科学的交叉学科研究,围绕从海量生物数据中解析分子间识别的模式特征这一目标,针对实现过程中数据稀疏、数据不足、特征捕捉、异构数据整合等关键问题,从多模态信息整合、序列特征提取、文本挖掘、异构网络等多个维度开发了多个先进的深度学习和机器学习模型,取得了一系列成果。共发表学术论文80余篇,其中通讯作者论文包括 Nature Machine Intelligence、Nature Communications、 Nature Computational Science、PNAS、Cell Systems、Nucleic Acids Research、 STTT、Protein & Cell、PLOS Computational Biology、Bioinformatics等,且多篇论文被计算生物学国际顶级会议RECOMB 和ISMB接收为口头报告论文。相关研究成果入选 ESI 高被引论文,获得“吴文俊人工智能自然科学”三等奖(2019年)、“中国生物信息学十大进展”(2次, 2018年和 2019年)、“中国生物信息学十大算法和工具”(2019年)、国际会议ICIBM 2019最佳论文等荣誉,获得国家杰出青年科学基金项目资助。曾坚阳课题组长期招收人工智能/机器学习、计算生物学和相关生命科学、药物化学等方向的博士后,未来科研方向围绕AI for Life Sciences展开,包括高通量实验方法开发、多组学测序方法开发、基于生物大数据的人工智能/机器学习模型开发、AI驱动的新型治疗方法开发和生物学知识发现等。

简历投递有意者请将个人简历等材料发至):
https://jinshuju.net/f/ZqXwZt扫描二维码投递简历


原文链接:
https://doi.org/10.1038/s42256-023-00634-4

制版人:十一


转载须知

【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/153347
 
158 次点击