第一作者:Emily So
通讯作者:Benjamin Haibe-Kains
第一单位:加拿大玛嘉烈公主癌症中心
DOI:10.1038/s42256-023-00688-4
作者独立重复了发表于Nature Cancer 2021、名为 “细胞系反应预测迁移”的TCRP工作,并在新的病例研究中提高TCRP的可复用性;在临床试验数据集中进行验证,证实TCRP在高标准临床环境中的优越表现。
在个性化医学和精确肿瘤学领域,ML和AI技术的使用得到了极大的关注。其中,开发能够预测癌症患者治疗反应的计算模型是该领域的重要问题。然而,由于获取大规模临床基因组数据的挑战,许多研究使用临床前药物基因组数据来训练预测模型,并用有限的患者数据来验证它们。《Nature Cancer》上提出了一种名为“细胞系反应预测转移”(TCRP)的方法,该方法利用极少的学习将药物反应预测从癌细胞系转移到患者来源的细胞培养和异种移植上。这份可重用性报告旨在确认TCRP模型的性能,并探索其在包含临床前药物基因组学和临床试验等更大数据集上的应用。
1.重复TCRP,探索其在包含临床前药物基因组学和临床试验数据的更大数据集上的应用。
1.复现性
该研究旨在重复最初发表的关于细胞系转移反应预测(TCRP)模型的结果。重复过程包括四个阶段:提取基因表达和药物反应特征;训练模型不可知元学习(MAML)算法;使用小样本学习对模型进行微调;在患者来源的肿瘤细胞(PDTC)样本上验证模型。
虽然作者提供了必要的数据集和代码库,但在复制某些方面存在挑战。一些药物和基线模型缺失,需要重新实施和超参数调整。尽管有这些困难,重新实现的TCRP模型证实了它在预测药物反应方面比现有的统计和机器学习模型更优越。然而,在这次复制尝试中获得的预测值略低于原始出版物中报告的值,这表明在特征提取、药物靶标名称或超参数调整方面存在潜在问题(图1)。尽管如此,使用相同的训练和验证数据集的TCRP模型展示了前景,并优于其他模型(图1a,b)。
2.可复用性
在不同的细胞系数据集(CTRP、GCSI和GDSC2)上评估TCRP模型性能,以确定其对临床前和临床数据集的适用性。在训练期间对每种药物的超参数进行了调整,并观察到最佳超参数在不同的数据集上有所不同。尽管如此,新训练的TCRP模型的表现始终好于基线模型,表明该方法在细胞系数据方面的鲁棒性(图2)。值得注意的是,当在药物紫杉醇的CTRPv2数据集上训练TCRP时,与参考数据集相比,获得的预测值较低,这表明训练数据的选择在开发有效的药物反应预测因子方面发挥了作用。
图2 在新的参考数据集上TCRP与普通基线模型性能比较
当在不同的临床前和临床方案上进行测试时,包括永生化细胞系、患者来源的异种移植和临床试验,TCRP在大多数环境中表现出比基准模型更好的性能,包括临床试验。然而,在UHNBreast细胞系数据集中,它的表现并不优于最近邻建模方法(图3a),而在更复杂的患者来源的异种移植和临床试验数据集中却优于所有其他方法(图3b-d)。总体而言,可重用性研究支持了TCRP模型将其预测价值转移到新环境的能力,展示了其了解癌细胞分子特征和药物反应之间的复杂关系的能力,并在更复杂的临床前和临床模型中实现了更好的性能。
图3 在三种新的验证环境中TCRP与其他基线模型性能比较
Benjamin Haibe-Kains,加拿大玛嘉烈公主癌症中心高级科学家。研究方向:1.来自基因组学概况和放射成像的预后模型;2.来自基因组学概况的治疗反应预测模型;3.研究的重复性、开放科学、以及开发和可持续的科学软件。
TCRP模型在重复性测试中成功地预测了各种情况下的药物反应,包括细胞系、患者来源的癌症模型和临床数据集。结果支持TCRP模型是一种预测临床药物反应的有效方法。通过将模型构建过程与数据查询和处理集成并自动化,可以轻松地评估和使用像TCRP这样的计算模型,为医学中人工智能的发展做出贡献。总体而言,这项可重复性和可重用性研究证实了TCRP方法在不同情况下的潜力,强调了其对精确肿瘤学的重要性,并提出了进一步开发和可用的途径。
转载须知
【原创文章】AItellU原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为AItellU所有。AItellU保留所有法定权利,违者必究。
投稿、转载及合作邮箱:
zjhuangjunjie@163.com
原文链接:
https://www.nature.com/articles/s42256-023-00688-4