2019年10月14日,斯坦福大学的Ash Alizadeh和Russ Altman实验室合作(第一作者为陈滨滨博士)在Nature Biotechnology杂志上发表了题为Predicting HLA class II antigen presentation through integrated deep learning的文章,研发了一款叫做玛丽亚(下称MARIA)的软件以更好地预测II类抗原呈递。
作者首先利用质谱(Mass Spectrometry)技术发现了大量的可呈递的II类抗原。通过18个套细胞淋巴瘤样本的分析,作者得到了超过两万三千个II类抗原。作者还融合了与抗原呈递有关的体外抗原亲和力数据、抗原基因表达水平和蛋白酶切割特征来训练MARIA(图1)。MARIA本身是一个多模态递归神经网络,可以同时考虑多种不同输入数据和不同长度的抗原序列来预测一个抗原的呈递能力。作为用户,只需输入抗原基因名,抗原序列和病人HLA等位基因名就可预测抗原呈递能力。 图1 MARIA 训练图
在发现MARIA可以成功预测抗原呈递后,作者进一步探索可否使用MARIA提高现有癌症疫苗挑选抗原的成功率。作者重新分析了两个先前在自然上发表的黑色素癌疫苗临床研究的结果【2,3】。MARIA对每个疫苗短肽重新评分,将每个短肽分为高、中、低上个呈递等级。虽然两个临床研究样本都较小,但MARIA对疫苗短肽的分级在两个不同研究数据中都和疫苗短肽离体免疫效力(Ex vivo Immunogenicity)显著正相关(p<0.05, 图4)。MARIA有希望成为未来帮助科学家和医生遴选癌症抗体的新工具。
图4 MARIA 预测病人免疫细胞对黑色素细胞癌疫苗的反应
在同一期,来自洛桑大学的Michal Bassani-Sternberg 实验室和David Gfeller实验室合作发表了名为Robust prediction of HLA class II epitopes by deep motif deconvolution of immunopeptidomes的相关文章。这一组作者同样利用质谱鉴定得到了大量II类抗原呈递数据并且开发了一款名叫MixMHC2pred的软件。作者得到了平均0.8左右的准确度AUC(原文Supplementary Fig. 7)。作者使用人工神经网络去寻找长度为9的抗原呈递基序(Motif)。作者的方法可以很好的提取人眼可以看懂的基序但有可能限制了模型的灵活性,导致AUC略低于MARIA。两个软件都对学术界开源免费。其他实验室在未来会继续比较二者在各种免疫学课题中的应用效果。
1. V. Jurtz et al., NetMHCpan-4.0: Improved Peptide-MHC Class I Interaction Predictions Integrating Eluted Ligand and Peptide Binding Affinity Data. J Immunol 199, 3360-3368 (2017).2. P. A. Ott et al., An immunogenic personal neoantigen vaccine for patients with melanoma. Nature 547, 217-221 (2017).3. U. Sahin et al., Personalized RNA mutanome vaccines mobilize poly-specific therapeutic immunity against cancer. Nature 547, 222-226 (2017).4. R. Marty Pyke et al., Evolutionary Pressure against MHC Class II Binding Cancer Mutations. Cell 175, 1991 (2018).