Py学习  »  机器学习算法

25年NC真因果推断HTE文章分享-机器学习驱动的转移性非小细胞肺癌(NSCLC)免疫治疗调整策略-2

灵活胖子的科研进步之路 • 2 月前 • 69 次点击  
文章首页
文章首页
思维导图
思维导图
  • 文章链接:https://www.nature.com/articles/s41467-025-61823-w

前文提要-第1部分链接

结果-continued

构建建模框架

构建建模系统的关键步骤如图1所示。在完成数据处理、匹配以及将数据划分为探索队列与验证队列后,我们采用了五种不同的评分函数(补充说明3)来初步构建子评分模型。每个子评分模型均通过严格的方式独立进行训练与调优,具体流程包括重复交叉验证、特征选择、特征排序及模型重构。随后,通过不同的融合技术对子评分模型进行融合以生成集成模型,从而降低单一类型模型不可避免的不确定性(补充说明4)。

图 1 | A-STEP 系统从数据收集到临床转化的整体流程
该示意图展示了 A-STEP 系统的工作流程,包括数据收集、数据预处理、建模以及向临床实践的转化。参与本研究的机构包括 MD 安德森癌症中心(MDACC)、抗癌联盟(SU2C)和丹娜 - 法伯癌症研究所(DFCI)。
图 1 | A-STEP 系统从数据收集到临床转化的整体流程 该示意图展示了 A-STEP 系统的工作流程,包括数据收集、数据预处理、建模以及向临床实践的转化。参与本研究的机构包括 MD 安德森癌症中心(MDACC)、抗癌联盟(SU2C)和丹娜 - 法伯癌症研究所(DFCI)。

图2展示了五种不同模型在交叉验证过程中的特征重要性分析结果:在各模型预测治疗效果时,FBXW7基因突变、APC基因突变,以及烟草暴露史、PD-L1表达水平和病理类型是最常被选中的参数。表2呈现了在交叉验证过程中,按推荐治疗方案分层后,各单一模型下免疫检查点抑制剂单药治疗(ICI-Mono)与免疫检查点抑制剂联合化疗(ICI-Chemo)的平均治疗效果。我们观察到,线性模型(子模型A)表现最佳,在训练集和测试集中均能降低两种治疗方案的风险;但该模型在外部验证队列中未保持这一效果——在模型推荐采用ICI-Mono方案的患者组中,早期疾病进展风险反而升高(增加13.6%,详见表3)。不同子模型分层结果间的两两相关性详见补充图3。

图 2 | 五种评分函数在重复交叉验证中的特征选择一致性
对五种评分函数进行了重复 5 折交叉验证(n=30),具体包括:(a)带泊松损失的线性模型、(b)带平方损失的广义加性模型(GAM)、(c)带泊松损失的广义加性模型(GAM)、(d)带逻辑损失的广义加性模型(GAM)以及(e)带逻辑损失的梯度加性模型
图 2 | 五种评分函数在重复交叉验证中的特征选择一致性 对五种评分函数进行了重复 5 折交叉验证(n=30),具体包括:(a)带泊松损失的线性模型、(b)带平方损失的广义加性模型(GAM)、(c)带泊松损失的广义加性模型(GAM)、(d)带逻辑损失的广义加性模型(GAM)以及(e)带逻辑损失的梯度加性模型

在三种单一评分模型的集成方法中,基于注意力机制的集成方法(命名为A-STEP,即“基于注意力的治疗效果预测评分法”)表现最优:在探索队列中,其加权风险降低幅度为13%~23%;在外部验证队列中,加权风险降低幅度为16%~19%(详见表3)。相比之下,除子模型B外,其他单一子模型及另外两种集成模型均未能达到显著的性能水平,尤其在外部验证过程中表现不佳。

A-STEP模型推荐方案的临床价值

随后,我们结合早期疾病进展情况,探究了A-STEP模型对不同治疗方案下患者无进展生存期(PFS)的预测能力。从患者实际接受的治疗方案角度分析发现:在探索队列中,遵循A-STEP模型推荐方案接受治疗的患者,无论采用ICI-Mono方案(风险比[HR,以“未遵循推荐方案组”为参照组]=0.76,p=0.048,图3a)还是ICI-Chemo方案(HR=0.63,p<0.001,图3b),均获得了更优的预后。这一结果在外部验证队列中同样得到验证:采用ICI-Mono方案的患者(HR=0.60,p=0.016,图3c)和采用ICI-Chemo方案的患者(HR=0.58,p=0.0076,图3d)中,遵循模型推荐方案者的预后均更优。此外,遵循模型建议额外接受化疗的患者,其中位生存期延长了4~5个月(图3b、d)。随后,我们还按照模型推荐的治疗方案进行了亚组分析(如图3e~h所示),也观察到了类似结果。值得注意的是,基于注意力机制的集成模型(A-STEP)性能优于所有单一子模型;各子模型的生存分层详细结果详见补充图4~7及补充表1。

图 3 | A-STEP 推荐方案对 2 年无进展生存期的影响
本图对比了基于以下两种分层方式的 2 年无进展生存期(PFS):(I)实际接受的治疗方案(REC,即 “Received”);(II)A-STEP 模型推荐的治疗方案(RECOM,即 “Recommended”)。其中,子图(a- d)代表探索队列,子图(e- h)代表外部验证队列。P 值通过双侧对数秩检验(two-sided logrank test)计算得出;图中展示了风险比(HR)及 95% 置信区间(CI),并以 “未遵循推荐方案组”(anti-recommendation group)作为参照组。原始数据已作为 “原始数据文件”(Source Data file)提供。
图 3 | A-STEP 推荐方案对 2 年无进展生存期的影响 本图对比了基于以下两种分层方式的 2 年无进展生存期(PFS):(I)实际接受的治疗方案(REC,即 “Received”);(II)A-STEP 模型推荐的治疗方案(RECOM,即 “Recommended”)。其中,子图(a- d)代表探索队列,子图(e- h)代表外部验证队列。P 值通过双侧对数秩检验(two-sided logrank test)计算得出;图中展示了风险比(HR)及 95% 置信区间(CI),并以 “未遵循推荐方案组”(anti-recommendation group)作为参照组。原始数据已作为 “原始数据文件”(Source Data file)提供。

在A-STEP模型中,联合化疗的个体化获益评分是通过基于注意力机制的方法融合五种不同评分函数后计算得出的。研究观察到,A-STEP 模型建议探索队列中 678 例患者中的 357 例(占比 53%)应更换治疗方案,其中 244 例来自免疫检查点抑制剂单药治疗(ICI-Mono)组,113 例来自免疫检查点抑制剂联合化疗(ICI-Chemo)组;同时,该模型建议外部验证队列中 318 例患者中的 160 例(占比 50%)更换治疗方案,其中 118 例来自 ICI-Mono 组,42 例来自 ICI-Chemo 组。

预测模型显示,至少有750名患者有望从“免疫治疗方案中加入化疗”这一调整中获益,其中探索队列有470人(占该队列获益人群的69%),外部验证队列有235人(占该队列获益人群的74%)。

为明确基于模型的分层(即“推荐治疗方案”与“实际接受治疗方案”)之间不同治疗效果的关联,我们采用交互图(interaction plots)进行分析,并以交互P值(p-interaction)作为量化指标。交互图可按治疗状态分解,呈现每个亚组内的平均治疗效果。当图中线条不平行时,即表明存在交互作用(线条越不平行,交互作用强度越大)。将该分析与方差分析(ANOVA)相结合,可帮助评估模型预测能力的统计学显著性。结果显示,A-STEP模型展现出显著的治疗效果:在探索队列中,交互P值<0.0001;在外部验证队列中,交互P值为0.0094(图4a- b及补充表2)。如补充图8-9所示,所有子评分模型的性能均未超过A-STEP。

图 4 | 探索队列与验证队列中的治疗 - 生物标志物交互图
(a)探索队列和(b)外部验证队列的交互图。原始数据已作为原始数据文件提供。
图 4 | 探索队列与验证队列中的治疗 - 生物标志物交互图 (a)探索队列和(b)外部验证队列的交互图。原始数据已作为原始数据文件提供。

此外,我们还将所提出的模型与评估预测性生物标志物的传统方法(如逐一协变量交互分析)进行基准对比,同时将CCND1和FBXW7作为单变量预测性生物标志物进行识别与验证(补充图10-11及补充说明5);我们还开展了基于风险分析的类似基准对比(补充图12及补充说明5)。另外,我们测试了吸烟状态作为患者治疗分层潜在预测性生物标志物的可行性,但发现其无法持续对不同治疗方案组患者的无进展生存期(PFS)进行有效分层(补充图13)。综上,这些结果表明,与我们提出的方法相比,传统统计方法在实现预测能力方面存在局限性。

单个临床基因组参数的影响

为进一步明确单个临床基因组特征对A-STEP推荐方案的作用,我们通过计算SHAP值(沙普利可加性解释值)展开分析。SHAP值是一种基于合作博弈论的知名方法,可拆解各特征间的相互作用对模型决策过程的影响。

图 5 | 基于 SHAP 值的 A-STEP 模型解读
该图为 A-STEP 模型的 SHAP 值解读结果,展示了按重要性排序的前 20 个特征,同时反映了这些特征对模型预测结果的影响方向(促进或抑制)与影响程度(强或弱)。原始数据已作为原始数据文件(Source Data file)提供
图 5 | 基于 SHAP 值的 A-STEP 模型解读 该图为 A-STEP 模型的 SHAP 值解读结果,展示了按重要性排序的前 20 个特征,同时反映了这些特征对模型预测结果的影响方向(促进或抑制)与影响程度(强或弱)。原始数据已作为原始数据文件(Source Data file)提供

(图5)阐明了交叉验证过程中筛选出的前20个重要特征,其中包含6个按重要性排序的临床风险因素。从临床风险角度来看,烟草暴露史是最重要的治疗调节因素;在判断患者是否能从额外化疗中获益时,其重要性仅次于APC基因突变和NTRK基因突变,位列第三。另一方面,FBXW7基因突变和MYC基因突变是与“免疫治疗联合化疗获益”相关性最高的特征。这一发现与各子模型的解读结果一致(补充图14):在子模型中,FBXW7基因突变和ALK基因突变始终倾向于支持联合治疗方案,而APC基因突变则始终倾向于支持免疫检查点抑制剂单药治疗(ICI-Mono)方案。

值得注意的是,单变量分析结果显示(补充图15),前20个重要特征中,没有任何一个特征能单独与治疗方案的选择形成显著关联。这一结果进一步印证了“对治疗效果调节因素的复杂相互作用进行建模”这一思路的合理性。

讨论

目前,关于免疫检查点抑制剂(ICI)单药治疗或ICI联合化疗的决策制定与患者筛选,可靠数据十分有限。因此,开发创新性的方法学手段以优化两种治疗方案的患者筛选流程,从而改善治疗结局、避免治疗不足(或过度治疗),具有至关重要的意义。本研究基于大规模真实世界数据,运用机器学习构建了一个预测模型,该模型能准确揭示患者从“免疫治疗联合化疗”中获得的个体化获益。研究发现,不同加权亚组算法之间存在协同作用,将这些算法整合为集成模型后,实现了稳健的患者分层效果,尤其在外部验证阶段表现突出。

传统的亚组识别方法包括未加权回归算法,这类算法将所有变量视为同等重要,可能会忽视关键变量的细微作用。与之相反,本研究证实了加权方法在亚组识别中的实用价值——该方法能更灵活地考量不同预测变量的重要性差异[19,20]。通过采用基于注意力机制的集成学习,对不同模型进行整合与协调,可生成一个稳健且具有临床意义的模型。该模型能更精准地识别出可从强化干预方案中获益的患者亚组,最终助力实现更有效的治疗。

此外,本研究还证实了该方法在解决临床实际问题中的适用性。以往的预测研究多聚焦于识别能从免疫治疗中获益的转移性非小细胞肺癌(mNSCLC)患者[8,21-23],但这与临床医生当前必须面临的决策问题并不完全相关——临床医生需要解决的是如何在(ICI单药与ICI联合化疗这两种方案中)做出选择。

与此不同,本研究聚焦于预测两种主要治疗干预手段(ICI单药与ICI联合化疗)的预期个体化获益[24],证实了该方法在指导临床相关治疗决策方面的潜力。基于我们此前的研究——该研究表明,在ICI治疗基础上联合化疗的最大获益在于预防3个月时的早期疾病进展[8]——本研究通过对比接受ICI单药治疗(ICI-Mono)与ICI联合化疗(ICI-Chemo)患者在3个月时的疾病进展模式,对预测模型进行了验证。有趣的是,当基于无进展生存期(PFS)对模型进行分层分析时,其对不同治疗方案的预测能力仍保持稳健。这提示,该模型在预测治疗期间早期疾病进展方面的有效性,或许可延伸至对长期生存结局的预测,但仍需开展专门分析予以证实。

本研究的一个显著优势在于,其纳入了来自多家大型癌症中心的2300例非小细胞肺癌(NSCLC)患者,涵盖了具有多样性的患者群体、临床实践模式及地理区域;这些“真实世界”数据有助于构建更能代表广泛人群的模型。这种多样性降低了模型对某一特定研究中心特征的过拟合风险,而大样本量则为检测潜在信号提供了充足的统计学效力。此外,我们在进行亚组分析前采用了倾向评分匹配法——这是一种公认的可降低选择偏倚、提高亚组内治疗效果估计有效性的技术。更重要的是,该方法提升了亚组分析的精确性与可靠性,确保观察到的结局差异更可能源于治疗本身,而非基线特征的潜在差异。

本研究深入探索了预测性生物标志物领域,阐明了其在早期疾病进展与治疗结局中的作用。我们的分析既突出了此前已被证实与“差异化获益”相关的特征(包括烟草暴露史),也助力构建了一种可整合多种不同特征的加权算法。需注意的是,本研究识别出的基因组变异(包括FBXW7和ALK基因突变),其功能意义尚不明确。此前有研究表明,FBXW7基因改变与ICI敏感性相关[25];而NSCLC中的ALK基因突变可能通过与更高肿瘤突变负荷相关联,进而影响治疗结局。尽管仍需进一步研究(尤其是利用包含全外显子测序、转录组学等更深层生物学信息的数据集)以明确差异化敏感性的生物学机制,但本研究结果表明,基于在各类治疗场景中均可便捷获取的临床基因组特征,得出具有临床意义的治疗选择推断是可行的。后续研究可助力验证这些发现、完善临床标志物,并指导更精准的治疗选择,以在最大化获益的同时将不良反应降至最低。

尽管本研究具有独特优势,但仍存在一些局限性。

  • 首先,任何回顾性分析都可能存在未测量的偏倚与混杂因素,因此该模型及研究结果需通过大型前瞻性队列进一步验证。

  • 其次,本研究聚焦于常规收集的临床基因组变量,主要原因是使用不常见信息会限制模型在“无法常规收集此类信息的医疗中心”的适用性。由于不同数据集可获取的临床与基因组数据存在差异,本研究仅采用了数量有限的“各数据集共有的特征”。未来,可将下一代测序(NGS)谱图、影像组学等更多多模态数据整合到建模中,这有望进一步提升模型性能。同样,在临床决策中,不仅需考虑治疗疗效,还需兼顾潜在毒性及其他众多可能影响患者结局的因素;而本研究以3个月疾病进展作为建模评估治疗响应的替代指标,未来研究需纳入长期结局及免疫相关不良反应进行分析。

  • 第三,机器学习模型的性能可能因人群差异或泛化能力局限而在不同数据集间波动,这一点在我们修订研究期间引入外部验证数据集时尤为明显。为应对这一局限,我们采用了集成学习法——通过整合不同模型以降低方差与不确定性。未来可通过蒙特卡洛模拟等先进技术,进一步推进不确定性量化研究。

  • 第四,为体现本研究的探索性本质,我们将假发现率(FDR)阈值设定为0.1(即10%),但同时也采用了严格的邦费罗尼校正法来评估统计学显著性水平。

  • 最后,尽管多种治疗方案的研发本质上是基础科学、药物研发与临床试验领域的挑战,但我们的方法旨在通过利用统计学与机器学习模型,从现有治疗方案中为个体患者识别最具潜力的治疗策略,以此补充上述领域的进展。我们认可这些基础性工作的关键作用,并致力于在此基础上进一步提升临床决策的精准性与有效性。

总之,A-STEP机器学习框架可为转移性非小细胞肺癌(mNSCLC)患者更精准地选择个体化全身治疗方案提供参考——我们通过明确哪些患者可从“ICI联合化疗”中获益,证实了该框架的价值。本研究不仅提供了一种整合多模态数据以指导复杂临床决策的方法,也为进一步开展生物学研究以明确治疗响应机制奠定了基础。

方法

研究设计与研究对象

本研究已获得德克萨斯大学MD安德森癌症中心(MDACC)、梅奥诊所(Mayo Clinic)和丹娜-法伯癌症研究所(DFCI)的机构审查委员会伦理批准。所有研究流程均遵循1964年《赫尔辛基宣言》的伦理标准。由于本研究为回顾性研究,故豁免知情同意。

本回顾性研究的目的是利用机器学习构建治疗推荐系统,为全身治疗(即含或不含化疗的免疫治疗)制定个体化治疗方案。研究采用MDACC、梅奥诊所和抗癌联盟(SU2C)的患者数据进行模型开发与超参数调优,随后采用DFCI队列的患者数据进行外部验证。各队列的具体情况简述如下:

MDACC队列

我们查询了德克萨斯大学MD安德森癌症中心由“肺癌登月计划”(Lung Cancer Moon Shot program)资助的GEMINI数据库,筛选出2020年至2022年期间接受免疫检查点抑制剂(ICIs)治疗的患者。纳入标准如下:(1)经病理证实为非小细胞肺癌(NSCLC),包括腺癌、鳞癌及其他病理类型;(2)开始接受ICIs治疗时为IV期疾病;(3)至少接受过2个周期的ICIs单药治疗或ICIs联合化疗。

梅奥诊所队列

将相同的纳入标准应用于梅奥诊所接受ICIs治疗的患者队列。该队列包含2019年至2020年期间在佛罗里达州梅奥诊所就诊的患者[8]。

DFCI队列

将相同的纳入标准应用于丹娜-法伯癌症研究所接受ICIs治疗的外部患者队列。该队列包含在丹娜-法伯癌症研究所连续就诊、同意参与编号为02-180、20-000和17-000的相关研究方案,且在2013年至2023年期间至少接受过一剂PD-(L)1抑制剂单药或联合化疗的患者。该队列数据的详细信息已在其他文献中发表[26,27]。

SU2C队列

该队列是一个包含9家癌症中心、393例接受PD-1/PD-L1抑制剂治疗的晚期NSCLC患者的公共联盟队列。该队列中以腺癌患者为主,其数据详情已在其他文献中发表[28]。

基因组分析

我们从病理报告和临床记录中收集了来自基因组分析或外部供应商的体细胞测序结果。包含内部体细胞测序数据的样本被纳入扩展基因组分析。如先前所述[29,30],突变分析在福尔马林固定石蜡包埋的肿瘤组织或血液样本上进行。对于MD安德森癌症中心的数据,组织分子分析采用基于NGS的方法检测134或146个基因的突变。测序或循环肿瘤DNA(ctDNA)检测采用MD安德森癌症中心液体活检panel(70个基因)或Guardant360 panel(74个基因)。为保证计算效力,纳入了任何时间点的样本,若在组织和/或血液中检测到突变事件,则认为该突变存在。对于在不同时间点有多个样本的患者,选择最接近ICI开始日期的样本。为保证不同测序panel分析的一致性,我们将基因组数据集限定为ctDNA panel中包含的70个基因。所有报告的非同义突变事件均被纳入;log2拷贝比<1(缺失)或>5(扩增)的拷贝数改变被纳入分析。由于测序panel规模较小,肿瘤突变负荷未被纳入。更多细节详见其他文献[8]。梅奥诊所、SU2C和DFCI数据集采用了类似的基因组事件筛选方法。最终,保留了不同队列中28个重叠基因用于下游建模分析。

个体化治疗方案

图1总结了表征治疗反应异质性和优化“在基础免疫治疗中添加化疗(或不添加)”相关定制治疗策略的整体流程。我们整合了28个基因组特征与临床风险因素(包括性别、年龄、烟草暴露史、病理类型、PD-L1表达水平和治疗线数)作为该框架的基础。

该计算系统包含几个关键步骤。首先,对汇总数据进行预处理和质量检查。基因组分析的细节如先前报告[8,26-28]所述。为解决回顾性偏倚和混杂因素,采用倾向评分匹配法识别具有相似特征的配对样本(补充说明1)。随后,通过递归特征消除确定最优子集用于模型构建。采用五种不同的加权方法,通过重复交叉验证(n=30)估计添加化疗的个体化获益(补充说明3)。当独立评分在验证期间未达到预期预测性能时,我们引入了不同的整合策略(H-STEP、S-STEP和A-STEP,补充说明4),通过利用不同方法的多样性捕捉数据中更广泛的模式,以减轻任何单一模型的潜在偏倚。同样,该整合系统在探索队列和外部验证队列中均进行了性能验证,以确保其可靠性和泛化能力。最后,我们从临床转化和模型解释的角度研究了模型的决策过程。

步骤1:治疗效果建模

在本研究中,我们做出了被证明足以说明干预措施因果依赖性的标准假设(详见补充说明2)。不失一般性,根据鲁宾潜在结果框架[31],给定期望结局O、治疗T和初始协变量C,预期结局E可表示为:E[O|T,C] = ∅(C) + T×Δ(C)/2,其中∅(C)是代表主要预后效应的函数,可计算为E[O|T=1,C] + E[O|T=0,C];Δ(C)表示治疗效果,可表示为E[O|T=1,C] - E[O|T=0,C]。构建E[O|T,C]模型需要基于协变量同时构建∅(C)和Δ(C)的函数。用于构建∅(C)的变量称为预后变量,而用于构建Δ(C)的变量称为治疗调节因素[24,32]。

创建最优个体治疗规则(ITRs)的传统方法包括同时使用∅(C)和Δ(C)预测结局,并使用这些基于模型的估计值来估计个体治疗效果(ITEs)。然而,这种方法需要准确设定∅(C)和Δ(C),尽管最终只有后者用于指导治疗选择。因此,∅(C)成为一个干扰参数,其设定可能影响治疗函数Δ(C)的估计——这一问题尤为突出,因为通常存在许多预后变量,但仅少数治疗调节因素会影响治疗推荐[10,33]。尽管如此,如果我们的目标是对个体治疗效果进行排序或制定个体治疗规则,那么只有治疗函数Δ(C)的排序或符号是相关的。因此,理想情况下,我们需要一种可靠的个体治疗效果估计方法,无需估计∅(C)[9,10]

本研究的终点是3个月时进展(记为O(1))或3个月时未进展(记为O(0))。用于比较的两种治疗方案为:ICI联合化疗(记为T=1)或ICI单药治疗(记为T=0)。此外,我们假设每位患者仅可观察到一种治疗结局(O(1)或O(0))。我们还假设T不依赖于(O(1), O(0))[31,34]。为分配治疗,我们假设在给定某些协变量C的情况下,接受治疗的概率由倾向评分π(C)表示,计算为π(Cᵢ)=Pr(T=1|C)。在随机试验中,该评分通常已知且不受C影响,但在观察性研究中需要进行估计。我们观察到的数据由n个独立同分布的(O,T,C)拷贝表示,记为{(Oᵢ,Tᵢ,Cᵢ),i=1,…,n}。

步骤2:通过加权方法估计个体获益评分

目标是利用加权亚组识别方法[9,10],基于协变量C开发个性化获益评分系统f(C),通过该系统可使用f(C)为个体患者推荐定制治疗方案。具体而言,我们将获益评分定义为满足以下两个标准的任意函数f(C):(i)反映患者从特定治疗中获益的程度;(ii)具有有意义且已知的临界点c,使得对于给定的协变量水平C,f(C)

另一个关注的指标是个体治疗规则(ITR),它是一个将患者协变量映射到治疗决策的函数,即d(C):C→T。最优个体治疗规则旨在通过为患者制定治疗决策以最大化价值函数V(d)=E[d(O)]=∫OdPᵈ(其中Pᵈ是给定T=d(C)时O,T,C的分布),从而最大化人群的平均结局。因此,Δ(C)可用于制定最优个体治疗规则。具体而言,f(C)的符号被用于最优个体治疗规则[9,10]。凸损失函数M(y;v)可用于估计获益评分,例如平方误差损失M(y;v)=(y-v)²。Chen等人[10]最初提出M(y;v)应满足两个条件:首先,对于每个固定的y,Mᵥ(y;v)=∂M(y;v)/∂v在v中单调递增;其次,Mᵥ(y;0)在y中单调。这些条件足以实现Fisher一致的亚组识别,但并非必需[9]。我们在补充说明3中介绍了用于估计获益评分并随后识别亚组效应的不同加权方法的公式。

步骤3:整合个体子评分系统

利用来自五个不同评分系统的获益评分,我们通过三种融合机制进一步构建了一个集成模型。其目的是捕捉不同独立系统中存在的共同和潜在互补信号,同时通过汇总多个模型预测来减少单个系统的偏倚和方差。整合步骤详见补充说明4。

步骤4:模型训练与验证

我们采用重复5折交叉验证策略(n=30)开发和微调子评分模型的超参数,包括基于探索队列的特征重要性。根据特征在150次运行中的选择频率对其进行排序,若至少50%的运行中被选中,则认为该特征具有信息价值。然后,我们锁定优化后的超参数,并在整个探索集上重新拟合各个模型,随后在外部验证队列中进行测试。所有模型均使用开源Python 3.9.8和R 3.6.1开发,并在NVIDIA DGX A100工作站上训练。

临床验证

为评估子模型和集成模型在估计患者从“免疫治疗联合化疗”中获益的预测能力,通过对比两个治疗组在亚组条件下的治疗效果,做出个体化推荐。利用个性化获益评分推荐化疗是否对患者有益。基于该推荐,将患者分为两个亚组:(i)按照模型推荐接受治疗的“遵循推荐”组;(ii)违背推荐接受治疗的“未遵循推荐”组。随后,我们通过全面分析(比较“遵循推荐”组与“未遵循推荐”组的效应指标,特别是加权风险降低率(WRR)、Kaplan-Meier曲线、对数秩检验和风险比(HRs))研究临床意义。简而言之,WRR代表通过遵循模型推荐可能避免早期疾病进展的患者百分比(详见补充表3)。

模型解释

最后,我们使用SHAP(沙普利可加性解释)分析[35]解释个体特征与模型推荐(ICI联合化疗vs ICI单药治疗)之间的关联,以量化每个特征对治疗效果的方向和大小的影响。

统计分析

主要终点定义为3个月时的早期疾病进展。疾病进展由主治医生根据肿瘤生长或新发病灶的影像学报告、病理确认和/或临床评估确定。我们还收集了无进展生存期(PFS)数据,其中仍存活且未进展的患者在其最后一次影像评估时进行删失。通过方差分析(ANOVA)计算推荐组和治疗组之间的交互作用p值。采用Kaplan-Meier分析和对数秩检验评估患者分层的统计学显著性。分别使用Wilcoxon符号秩检验或χ²检验比较不同组中连续变量或分类变量的分布差异。为校正多重统计检验,采用Benjamini-Hochberg方法控制假发现率(FDR)。所有统计检验均为双侧检验,p值<0.05或FDR<0.1被认为具有统计学显著性。所有统计分析均使用R 3.6.1完成。

相关课程推荐

基于AI辅助Python/R编程的机器学习与因果推断在医学研究中的应用培训班

科研合作及科研服务项目介绍-v0.6

  1. 方法学实现语言:R语言,Python,SPSS,PASS(样本量计算)

  2. 服务形式:科研方案设计及方法学指导,数据分析及图表制作,可开发票,具体情况可联系助教程老师

  3. 优先进行10+文章科研合作,具体请联系助教

助教微信-程老师
助教微信-程老师

部分内容说明

因果推断/真实世界研究/临床研究

  • 1.多重插补后组间基线表SMD-标准化差异率对比
  • 2.多组的倾向性评分匹配及逆概率加权实现,有向无环图的绘制及解释(DAG)
  • 3.亚组分析及亚组交互作用P值计算并绘制图表
  • 4.生存数据永恒时间偏倚的克隆删失加权法实现及设计
  • 5.基于界标法的区段生存分析(landmark survival analysis)
  • 6.基于联合法或界标法的动态预测模型构建及验证
  • 7.机器学习预测模型的(二分类及生存)的构建与验证
  • 8.限制性立方样条确定非线性效应截断值并进行区段回归分析(piecewise regression )
  • 9.潜类别分析
  • 10.规则关联分析
  • 11.面板数据分析
  • 12.纵向数据分析(广义线性混合模型,广义估计方程,多变量重复测量方差分析)
  • 17.目标试验模拟分析及试验设计
  • 18.G参数法进行纵向数据分析(g formula)
  • 19.多层级倾向性评分处理多中心PSM情况(Multi-cluster PSM)
  • 20.重叠加权及后续效应值估计(包括生存分析)
  • 21.治疗效果异质性敏感性分析(PATH)-内科学年鉴方法
  • 22.基于反事实推定的治疗异质性分析
  • 23.机器学习因果推断
  • 24.治疗效果异质性分析
  • 25.双重机器学习利用正交化进行因果推断

文献计量学分析及图表解释

  • 1.协助制定检索策略并进行相关文献检索下载元数据
  • 2.文献分布情况整体分析,包括引用情况分析
  • 3.基于关键词的动态分析及可视化
  • 4.核心作者及核心国家分析,包括合作关系网络分析
  • 5.核心杂志鉴定及动态变化分析
  • 6.全局及局部核心文献鉴定
  • 7.关键词动态变化分析及主题凸现分析

人工智能类研究

  • 1.结构化数据机器学习的批量建模及最优模型选择-mlr3/pycaret
  • 2.结构化数据生存数据的批量建模及最优模型的选择
  • 3.传统影像组学特征提取及后续基于机器学习的分析全流程分析
  • 4.机器学习及深度学习模型可解释方法学实现(shap/lime/迭代法等)
  • 5.各种变量筛选方法的实现(RLE/重要性/过滤法/包装法等)
  • 6.基于CNN的医学影像数据的深度学习方法学实现
  • 7.CT/MRI/超声等医学影像学数据的传统影像组学分析
  • 8.CT/MRI/超声等医学影像学数据的深度学习

生物信息学分析

  • 1.传统转录组差异-富集分析
  • 2.反卷积及细胞比例鉴定分析
  • 3.SNP相关分析
  • 4.CNV相关分析
  • 5.甲基化数据相关分析
  • 3.单细胞降维、聚类及细胞鉴定
  • 4.单细胞轨迹分析及细胞速率分析

欢迎关注我的视频号-定期直播免费文献分享会

扫一扫,添加我的视频号
扫一扫,添加我的视频号

欢迎关注我的B站账号-公开课及文献分享视频会更新至此

我的B站
我的B站
我的小红书
我的小红书

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/188841