撰文丨菠萝西瓜了解患者的肿瘤类型对于癌症临床决策、指导治疗选择和临床试验招募至关重要。肿瘤类型诊断通常通过组织学和免疫组织化学分析进行,但这些技术可能是不确定的,特别在患者的肿瘤分化不良,或者在区分独立的原发肿瘤或克隆相关的转移瘤情况下。总体而言,由于不正确的肿瘤类型诊断可能导致错误的治疗决策和不良的患者预后,因此临床需要改进肿瘤类型诊断方法,作为精准肿瘤学增强决策支持的一种形式。 大规模的泛癌基因组分析表明,许多基因组改变和特征与特定的肿瘤类型相关。因此,肿瘤的临床基因组分析已经普遍用于识别治疗上可靶向的改变并指导精准肿瘤治疗的选择,用来指导和完善癌症类型的诊断。临床基因组测序通常使用一组癌症基因进行分析,主要针对已知在不同癌症类型中反复改变的基因的特定突变。Memorial Sloan Kettering的MSK-IMPACT检测组是一项FDA授权的临床测试,可分析500多个已知癌症基因的体细胞和种系改变,并已对超过75,000名患者进行了测序分析。由此,依赖于来自代表真实癌症类型发生率的大型患者队列的易于获取的临床基因组数据,根据MSK-IMPACT数据开发分类器将解决与临床可行性相关的许多限制。此外,深度学习架构已被证明可以提高WES、WGS和转录组数据背景下类似任务的性能,但尚未在目标癌症基因组的背景下进行探索。由此,临床基因组分析整合深度学习模型对于拓展肿瘤类型预测能力极具潜力性。 近日,来自美国纪念斯隆-凯特琳癌症中心(Memorial Sloan Kettering Cancer Center)的Quaid Morris教授和Michael F. Berger教授合作在 Cancer Discovery 杂志上发表文章Deep Learning Model for Tumor Type Prediction using Targeted Clinical Genomic Sequencing Data。本研究中,研究团队基于临床靶向癌症基因组测序表征的基因组特征开发出了基因组衍生诊断集成(Genome-Derived-Diagnosis Ensemble,GDD-ENS):一种使用深度神经网络对肿瘤类型进行分类的超参数集成,该工具可提供临床相关的肿瘤类型预测,并辅助指导治疗决策。 基因组改变可以高度诊断肿瘤类型,并且已经探索了根据基因组特征训练的肿瘤类型分类器,但最准确的方法在临床上并不可行,其依赖于全基因组测序(WGS)衍生的特征,或仅预测有限的癌症类型。研究团队使用临床靶向癌症基因组测序的39,787个实体瘤数据集中的基因组特征来开发基因组衍生诊断集成(Genome-Derived-Diagnosis Ensemble,GDD-ENS):一种使用深度神经网络对肿瘤类型进行分类的超参数集成。在持续的优化中,GDD-ENS对38种癌症类型的高置信度预测准确率达到93%,可与基于WGS的方法相媲美。此外,GDD-ENS还可以指导罕见类型和原发灶未知的癌症诊断,并结合患者特定的临床信息以改进预测。总体而言,将GDD-ENS整合到前瞻性临床测序工作流程中可以提供临床相关的肿瘤类型预测,以实时指导治疗决策。 综上所述,研究团队搭建了一种专为临床实施而设计的高度准确的肿瘤类型预测模型,该模型仅依赖广泛使用的癌症基因组测序数据,可预测38种不同的癌症类型,并支持整合患者特定的非基因组信息,以在具有挑战性的诊断情况下增强决策支持。 原文链接:https://doi.org/10.1158/2159-8290.CD-23-0996