Py学习  »  机器学习算法

5+机器学习+实验验证+免疫浸润,可谓是非肿瘤生信结合实验验证的范文,值得收藏!

生信分析手册 • 9 月前 • 149 次点击  

导语

今天给同学们分享一篇生信文章“Bioinformatic analysis of related immune cell infiltration and key genes in the progression of osteonecrosis of the femoral head”,这篇文章发表在Front Immunol期刊上,影响因子为5.7。


结果:


分析mRNA的转录组学特征
为了探讨ONFH对软骨下骨的影响,作者利用基因芯片分析了从ONFH患者和对照患者获得的软骨下骨组织中的mRNA表达谱。上述表达谱数据和GSE 74089表达谱数据都经过标准化程序。使用R包“sva”缓解批次效应,结果如图1所示。DE mRNA的识别标准设定为log 2|倍数变化|≥ 2.0和P < 0.05。总共鉴定了107个DE mRNA,包括76个下调和31个上调的转录本。如图2所示,采用分层聚类来可视化样品中DE mRNA的独特表达模式。


富集分析结果作者通过整合来自软骨样品的表达谱数据,对ONFH的基础机制进行了彻底的研究
为了阐明与ONFH相关的骨软骨损伤有关的DE mRNA的生物学功能,作者对鉴定的107种DE mRNA进行了包括GO和KEGG富集评估的分析。GO分析揭示了基于GO的DE mRNA的主要功能,在各种功能类别中观察到富集,如细胞迁移、成骨细胞分化、软骨发育、细胞外区域、细胞外基质、钙离子结合、β受体结合和其他相关条目(图3A)。从KEGG数据库中鉴定的富集途径主要包括唾液分泌、金黄色葡萄球菌感染、糖尿病并发症中的AGE-beta信号传导途径和其他相关途径(图3B)。在DE mRNA上进行GSEA后,图3C中显示了途径的显著差异,例如戊糖和葡糖醛酸相互转化、造血细胞谱系和核糖体。

关键基因筛选
机器学习算法用于进一步筛选表达的关键基因。将107个差异表达基因的表达谱数据输入LASSO回归和SVM-RFE模型。LASSO回归,实施10倍交叉验证以优化错误率,辨别出11个特征基因:APOD、CFHR 3、CSN 1 S1、FBXO 43、HBEGF、HLA-B1、INSM 1、LRP 12、MRPS 2、POLE和SFTA 3(图4A、B)。同时,SVM-RFE模型鉴定了8个特征基因:ZW 10、LRP 12、LYZL 6、APOD、IFI 6、EDN 3、FBXO 43和AMY 2B(图4C)。通过两种算法选择的特征基因的交叉导致APOD、LRP 12和FBXO 43作为关键特征基因的明确鉴定(图4D)。为了验证该基因的诊断预测价值,采用ROC曲线分析。在测试集(GSE 7116)中,当APOD、LPR 12和FBXO 43被拟合为一个变量时,诊断效率达到较高水平(AUC = 0. 05)。964,95%CI = 0.904 - 1.000)(图5A-D)。提示APOD、LPR 12和FBXO 43在ONFH与健康对照组的鉴别诊断中具有较好的价值。


DE mRNA的qRT-PCR验证
为了验证微阵列数据的可靠性,作者使用qRT-PCR定量4名ONFH患者和4名对照患者中的APOD、LPR 12和FBXO 43表达。qRT-PCR结果显示关键基因的表达水平与微阵列分析结果一致(图6)。

关键基因与hBMSCs成骨分化的关系
为探讨关键基因与成骨表型形成的关系,采用qRT-PCR和碱性磷酸酶(ALP)染色方法,分别对成骨诱导组和正常组培养3、7、14 d的BMSC进行分析。ALP染色结果显示,ALP活性在成骨诱导过程中逐渐增加(图7A、B)。同时采用qRT-PCR检测成骨相关基因。与对照组相比,成骨细胞组相关基因的表达水平显著升高(P< 0.05)。此外,在成骨的第3、7和14天,成骨组中的APOD表达水平显著高于对照组中的APOD表达水平,但两组之间的FBXO 43和LRP 12没有统计学显著差异(图7 C-E)。

免疫细胞浸润分析
利用CIBERSORT算法分析ONFH患者和对照组的微阵列数据中的免疫细胞浸润模式。条形图说明了所有样品中22种不同免疫细胞类型的百分比(图8A)。值得注意的是,与健康对照相比,ONFH患者表现出较低水平的中性粒细胞、单核细胞、巨噬细胞M2和活化的树突状细胞,同时静息的树突状细胞水平升高(图8B)。相关分析显示静息树突状细胞与中性粒细胞(r= -0.46)、单核细胞(r= -0.47)、静息树突状细胞(r=-0.42)、巨噬细胞M2(r= -0.11)呈负相关。相反,在活化的树突状细胞与中性粒细胞(r= 0.83)、单核细胞(r= 0.59)以及巨噬细胞M2(r= 0.28)之间观察到正相关(图8 C)。

总之,确定了免疫浸润的明显差异。此外,APOD显示与中性粒细胞(r= 0.778,P< 0.001)、活化的树突细胞(r= 0.689,P= 0.003)和单核细胞(r= 0.732,P= 0.001)正相关,同时证明与静息的树突细胞负相关(r=-0.540,P= 0.031)(图9A)。LRP 12表现出与巨噬细胞M0的正相关性(r= 0.522,P= 0.037),同时证明与中性粒细胞(r=-0.808,P< 0.001)、单核细胞(r=-0.736,P= 0.001)和活化的树突状细胞(r=-0.629,P= 0.009)和巨噬细胞M2(r=-0.566,P= 0.022)的负相关性(图9 B)。FBXO 43表现出与嗜中性粒细胞(r= 0.801,P< 0.001)、活化的树突状细胞(r= 0.661,P= 0.005)、单核细胞(r= 0.652,P= 0.006)和巨噬细胞M2(r= 0.605,P= 0.013)的正相关性,同时证明与静息的树突状细胞(r=-0.502,P= 0.047)和巨噬细胞M0(r=-0.503,P= 0.046)的负相关性(图9 C)。总之,APOD、LRP 12和FBXO 43均与免疫细胞相关。

总结

在整合数据集后,Limma方法揭示了107个DEG,包括76个下调基因和31个上调基因。富集分析显示这些DE mRNA与细胞迁移、成骨细胞分化、软骨发育和细胞外区等功能密切相关。机器学习算法进一步将APOD、FBXO 43和LRP 12确定为关键基因。ROC曲线表明这些基因的高诊断效率。qRT-PCR结果显示关键基因的表达水平与芯片分析结果一致。体外实验结果表明,APOD与BMSC的成骨分化密切相关。免疫浸润分析提示ONFH与中性粒细胞、单核细胞、巨噬细胞M2、树突状细胞活化和静息状态的失衡密切相关。对这篇文章感兴趣的老师,欢迎扫码咨询!


往期推荐

                                                                                                                       


纯生信选刊


• 纯生信文章的春天!

• 选刊正确=成功发表!


非肿瘤生信


• 6+非肿瘤代谢思路

• 非肿瘤联合铁死亡生信思路


预后模型


• 7+乳酸相关预后模型

• m7G甲基化+肿瘤生信思路


单基因生信


• 8+单基因干湿结合生信思路

• 单基因突变和淋巴结转移


单细胞系列


• 7+的脂肪细胞+单细胞测序

• 单细胞+Bulk seq生信思路

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/178142