
如果您对骨科疾病生信临床研究感兴趣,请为小骨点点关注,持续解读骨科前沿生信文献和思路。如果您需要定制化服务,欢迎扫码联系小骨~
大家好,今天分享一篇有关机器学习的文章,让我们一起看看它研究方法有哪些亮点吧!研究亮点
1.整合机器学习算法筛选关键基因:通过整合多种机器学习算法,从前列腺癌数据集中筛选出120个骨转移相关基因(BMRGs),并进一步筛选出10个关键基因。其中8个基因的ROC曲线下面积(AUC)值大于0.85,显示出对前列腺癌骨转移的优异预测效能。
2.构建并验证骨转移相关预后指数:基于20个预后基因,构建了包含6个基因的骨转移相关基因预后指数(BMGPI)。该模型在训练队列和验证队列中均表现出良好的预测能力,能够有效区分高风险和低风险患者,且预测性能优于传统临床指标。
3.揭示基因与免疫微环境的关联:分析不同风险组的免疫特征,发现高风险组患者免疫评分更高、肿瘤突变负荷(TMB)更高、对免疫治疗响应更差。这表明BMGPI与肿瘤免疫微环境密切相关,为评估免疫治疗响应提供了新依据。
4.提供精准治疗新指标:将BMGPI作为独立风险因素,与前列腺癌患者的无病生存期关联分析,发现其对预后有显著影响。该研究为前列腺癌的精准预后和个体化治疗提供了新的工具和方向。
该研究在方法和实施上具有较高的难度。首先,研究涉及对多个大型前列腺癌基因表达数据集的整合分析,需要处理复杂的生物信息学数据,筛选出与骨转移相关的基因。其次,构建骨转移相关基因预后指数(BMGPI)时,运用了多种机器学习算法,包括Cox回归、LASSO回归等,这不仅要求研究者具备扎实的统计学和机器学习知识,还需要对算法进行优化和验证。此外,研究还深入探讨了基因与肿瘤免疫微环境的关系,分析了免疫评分、肿瘤突变负荷、体细胞突变等多个维度,进一步增加了研究的复杂性。整体而言,该研究在数据处理、模型构建和多维度分析方面都面临了较高的技术挑战,但通过创新性方法和严谨的分析流程,成功揭示了前列腺癌骨转移的关键基因特征和预后指标,为临床应用提供了新的思路。如果各位老师需要数据分析及其他生信服务,欢迎扫描上方二维码,联系小骨哦❤️❤️
下面让我们一起来看看具体文章内容吧!
文章标题:Integrated machine learning algorithms reveal a bone metastasis-related signature of circulating tumor cells in prostate cancer
中文标题:集成的机器学习算法揭示了前列腺癌循环肿瘤细胞的骨转移相关特征
发表期刊:Scientific Data
发表时间:2024年6月
影响因子:5.8/Q1
研究目的
前列腺癌(PCa)是全球第二大流行肿瘤,也是男性死亡的主要原因。高达90%的晚期前列腺癌患者有骨转移。循环肿瘤细胞(CTCs)是进入人外周血的肿瘤细胞,其转移性定植是肿瘤转移的前哨过程。随着液体活检技术的逐渐成熟,血液中稀缺的CTCs可通过多种方法分离,这些方法为CTCs的进一步测序提供了条件。
研究方法
本研究通过差异表达分析获得120个BMRGs(骨转移相关基因)。同时,使用PPI网络筛选10个前列腺癌转移事件的诊断标志物。采用Cox回归分析寻找影响预后的基因构建模型,对患者进行分组。
研究结果
1.前列腺癌骨转移相关基因的鉴定
在GSE67980队列中,筛选了1994个DEGs。在GSE32269队列中,在骨转移样本和原发样本之间鉴定了624个DEGs。在1994个DEGs中,CTCs中有259个基因上调,1735个基因下调。上调基因主要富集于RNA剪接和蛋白质折叠与稳定(图A)。而下调基因则与细胞粘附和血管生成相关,并参与PI3K-Akt信号通路和Ras信号通路(图B)。在前列腺癌骨转移样本中,有249个基因上调,345个基因下调。上调基因参与细胞分裂和细胞周期(图C),下调基因富集于血管生成、衰老和代谢途径(图D)。
基于120个BMRGs构建了PPI网络,连接度大于10的前10个基因,包括ACTA2、ACTG2、CNN1、COL1A1、LMOD1、MYH11、MYL9、MYLK、TAGLN和TPM2(图A)。此外,使用MCODE插件进一步筛选了三个模块,最突出的模块如图B所示。这个模块仍然包括上面提到的十个基因。随后,iRegulon插件也对10个交集基因的主调控因子进行了探索,发现其中9个受SRF调控(图C)。
3.基于集成计算框架的BMGPI模型的开发与验证
首先,单因素Cox分析从120个BMRG中鉴定出20个预后基因。对这20个基因进行了94种基于机器学习的算法组合。进一步计算了每个组合模型中训练和验证队列的c指数。在94个模型中,Lasso + RSF和RSF模型同样是最优的。Lasso + RSF模型包含11个基因,而RSF模型仅包含6个基因。因此,考虑到实用性和转化潜力,将RSF模型作为最优模型,作为后续分析的基础。
采用单因素和多因素Cox分析评价BMGPI及其他临床特征与患者预后的关系。在TCGA和MSKCC组中,BMGPI被确定为PRAD患者的独立预后因素(图A)。为了扩大模型的临床应用价值,在风险水平、病理T分期和Gleason评分的基础上,构建了预测1、3和5年生存的nomogram(图B)。文章小结
该研究通过机器学习结合了基因表达数据、PPI网络以及药物敏感性数据,开发了一个新的预后指标,BMGPI。如果您对生信分析和公共数据库挖掘感兴趣,但时间和精力有限或者缺乏相关经验,小骨非常乐意为您提供如下服务:免费思路评估、付费方案设计和生信分析等,有意向的老师欢迎联系小骨哦!