社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

Nat. Mach. Intell. | 基于深度学习的T细胞受体和抗原结合特异性预测

DrugAI • 3 年前 • 386 次点击  

编译 | 余梁

审稿 | 陈梓豪

今天给大家报道的是来自MD Anderson Cancer Center的Alexandre Reuben团队发表在Nature Machine Intelligence上的文章Deep learning-based prediction of the T cell receptor–antigen binding specificity。在本篇文章中,作者构建了一个pMHC-TCR结合预测网络(pMTnet),该模型基于迁移学习,用来预测新生抗原(neoantigens)和T细胞受体(T-cell receptors, TCRs)结合特异性。



1

介绍

新生抗原(neoantigens)是肿瘤细胞表面主要组织相容性复合体(major histocompatibility complex, MHC)蛋白表达的短肽,它由突变基因转录和翻译而来。新生抗原是T细胞的靶标,通过T细胞受体(T-cell receptors, TCRs)发生相互作用。因此,新生抗原是免疫编辑中很重要的角色。但是,不是所有的新生抗原都能引发T细胞反应,人们对TCR与出现在MHC分子(pMHC)上的新生抗原结合特异性所知甚少。因此,建立pMHCs与TCR序列的联系至关重要,它可以改善免疫治疗的设计与实现。


在本文中,作者构建了一个名为pMTnet的迁移学习网络,用于预测I类pMHCs与TCR的结合特异性。作者把pMTnet用于人类肿瘤序列数据并进行了一系列观察。总的来说,pMTnet解决了长期存在的TCR-pMHC配对预测问题,揭示了基因组规模的生物观点,它也可以作为生物标记的基础用于预测免疫反应。


2

结果

TCR-抗原结合特异性。为降低预测任务的难度,作者将此分为3个步骤。首先,作者训练一个LSTM网络(图1c),来获得抗原和MHCs的蛋白序列的嵌入(仅Ⅰ类)。其次,作者利用堆叠的自编码器训练TCR序列嵌入(图1a),再次编码TCR序列。最后,在这些嵌入外创造一个深度神经网络,以将来自TCR、抗原肽序列和MHC等位基因的知识以具有生物学意义的方式结合。(图1e)。作者还通过微调确定TCRs和pMHCs预测模型。作者创建了10倍于正例数量的负例,训练150轮结果如图1f所示。

图1:模型细节


pMTnet预测TCR-pMHC。作者从独立的研究中收集了619对经过实验验证的TCR-pMHC数据对,进行了一系列验证分析。在测试中,删除了训练数据集中出现的数据对。测试集的结果显示AUC可达0.827,AUPR可达0.566,如图2a所示。为了判断pMTnet是真正地学到了结合特征还是记住了样例,作者观察了与训练集TCRs具有不同相似度的TCRs的预测表现,如图2b所示。作者还与其它模型进行了比较。接下来,作者通过结合T细胞的期望影响进行了验证,如图2c所示。作者进一步分析了pMTnet能够区分多肽序列的细节对TCR结合特异性的影响。


图2:pMTnet表现


作者利用前瞻性实验数据进一步验证pMTnet,发现具有更强结合力的TCRs展现出更高的克隆比例(图3a),还观测到更强的富集和更小的优势比(图3b)。通过对比T细胞,作者观察到在T细胞增殖、迁移、存活和细胞毒性的关键途径中富集的差异表达基因(图3c)。作者还计算了最佳TCR克隆型的克隆大小,并发现大多数TCR克隆型展现出更大的克隆比(图3d)。


图3:前瞻性验证


结构分析。作者实施残基对突变,并记录野生TCRs和突变TCRs结合水平的差异。作者将TCR的CDR3分为6个长度相等的片段(图4a),中间片段的残基更有可能诱发亲和力的变化。作者发现接触残基比非接触残基更有可能诱发更大的预测pMHC结合强度变化(图4b)。图4d和4e展示了一个TCR-pMHC的结构实例。


图4:对相互作用的结构分析


人体肿瘤TCR-pMHC交互。作者分析了数据集中最具免疫原性肿瘤类型的TCR和pMHC交互。图5a展示了一个ccRCC患者的总抗原和免疫抗原数。对于所有癌症类型的患者,作者计算了新生抗原、自抗原和HERV-E的免疫性抗原比例,作者观察到新生抗原比自抗原更具免疫性(图5b)。其次,作者检验了TCR-pMHC交互的影响。作者展示了能否结合任意抗原的TCRs平均克隆比例(图5c)。


图5:人类肿瘤中TCR-pMHC相互作用


TCR-新生抗原交互影响肿瘤进展和免疫治疗反应。作者检查了LUAD、LUSC、SKCM和RCC中NIES与病情之间的关系,并推断当有足够的T细胞渗透物时,新生T细胞更有可能激活。有趣的是,在肺癌和黑色素肿瘤患者中,更高的NIES与更高的生存率相关(图6a-c)。多变量分析也被用在存活率与NIES存量当中(图6f)。相似的结果也发生在不同的阈值上(图6g)。


图6:TCR-新生抗原交互反应影响


3

讨论

本文模型仅需给定TCR序列和(新生)抗原序列以及MHC类型即可完成TCR结合特异性预测,并进行了一系列基因组范围的分析。该模型还可用于治病治疗以及设计TCR-T或新生抗原治疗。总体而言,本文证明了TCR和PMHCs之间的配对,仅给予TCR、抗原和MHC序列的情况下是机器可学习的,这为将来产生更高精度TCR抗原预测模型的研究奠定了基础。


参考资料

Lu, T., Zhang, Z., Zhu, J. et al. Deep learning-based prediction of the T cell receptor–antigen binding specificity. Nat Mach Intell (2021).

https://doi.org/10.1038/s42256-021-00383-2

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/121387
 
386 次点击