大家好,这周推荐的是近期发表在Nature Communications上的计算文章,Deep learning boosts sensitivity of mass spectrometry-based immunopeptidomics。通讯作者为慕尼黑工业大学生命科学学院的Mathias Wilhelm教授和Bernhard Küster教授。他们在2014年发表了人类蛋白质组的草图,在本工作中,他们采用深度学习辅助质谱鉴定,提高了HLA的鉴定水平。
利用质谱鉴定人类白细胞抗原(HLA),对于开发免疫肿瘤学疫苗和药物具有巨大的潜在帮助,在癌症患者的HLA配体中识别新表位已成为潜在治疗干预的主要来源。然而非tryptic肽的鉴定在计算上仍然面临着巨大挑战。传统质谱鉴定方法并没有考虑二级谱的强度,作者在近期的工作中展示对tryptic肽的鉴定如果考虑强度可以大大提高鉴定效率。
本文作者在ProteomeTools项目中合成并分析了超过30万条非tryptic肽,包括17万HLA
I和7万II类配体以及蛋白酶AspN和LysN的产物各三万多条,同时作者还整理了1亿条之前报道过的tryptic肽的谱图数据。为了解决非tryptic肽的鉴定问题,作者筛选了900万非tryptic肽和2100万tryptic的HCD谱图作为训练集(以及CID数据集),使用深度学习框架Prosit对结果数据可以进行单模型训练,从而能够准确预测tryptic肽和非tryptic肽的片段离子谱图。
应用Prosit显示HLA肽的鉴定可提高7倍,87%的蛋白酶体拼接HLA肽可能不正确,并且在已公布的数据中,可从患者肿瘤中鉴定出数十个额外的免疫原性新表位。
总之,本文提供的多肽、谱图和计算工具大大扩展了免疫肽组学工作流程的分析深度。
本文作者:LY
责任编辑:Guo ZH
原文链接: https://www.nature.com/articles/s41467-021-23713-9
文章引用:DOI: 10.1038/s41467-021-24263-w