Py学习  »  机器学习算法

IF=6.1,2区Top,生信老朋友!不想加湿实验又想发高分,单细胞+机器学习应该怎样升级?

挑圈联靠 • 6 月前 • 176 次点击  

欢迎来看雪球讲套路、讲文献!昨天雪球带大家读了一篇构建预后预测模型的6+文献,今天雪球就“端水”一下,为大家讲解一篇诊断模型的6+SCI,同样是构建具有临床意义的模型,两篇文章的思路和分析技术可不相同。跟雪球一起来精读这篇文献吧!


别看这篇文章使用了单细胞+机器学习的分析,就觉得硬件要求、代码能力门槛高,不敢上手做。随着开源工具的增加,以前咱们觉得特别高大上的分析,纷纷都更好上手了。打好基础后,凭借这些经典套路的延展性,做进化,也能有效上分。

零基础?基础薄弱?寻求进步?不敢上手做?

来试试雪球团队沉淀的普通人也学得会的内训模型

添加雪球回复“卓越计划”详细了解



添加雪球后回复“1

进群跟紧干货直播,更有好礼相送

不怕没时间,错过可以看回放!


Deciphering the cellular and molecular landscape of pulmonary fibrosis through single-cell sequencing and machine learning

通过单细胞测序和机器学习解读肺纤维化的细胞和分子图谱


期刊:Journal of Translational Medicine

IF:6.1

发布时间:2025/01/02


 技术路线 


数据获取:

从GEO数据库中收集了GSE110147、GSE213001、GSE136831和GSE150910等数据集,为肺纤维化的研究提供了基因表达数据。


单细胞测序数据预处理:

使用Cellranger软件对原始数据进行处理,包括比对、过滤、条形码校正和UMI计数,以及使用Seurat进行数据集成,消除批次效应。


细胞聚类和注释:

使用UMAP方法将高维数据映射到二维空间,根据基因表达模式将细胞分为七种类型,包括B细胞、树突细胞、内皮细胞、上皮细胞、巨噬细胞、NK细胞和平滑肌细胞。


差异表达基因(DEGs)分析:

通过比较分析,识别出1104个差异基因,并与巨噬细胞相关基因集合交集,得到20个与巨噬细胞相关的肺纤维化差异基因。


功能富集分析:

GO分析显示这些基因主要涉及转录因子活性的调控等生物学功能;KEGG分析显示这些基因主要富集在PI3K-Akt信号通路等路径中。


构建肺纤维化诊断模型:

通过随机森林分析等方法,确定了与诊断密切相关的三个关键基因TMEM52B、PHACTR1和BLVRB,并构建了具有高准确性和最小误差的诊断模型。


诊断模型的验证:

使用外部数据集对关键基因的表达进行验证,并通过ROC曲线分析证明了模型的高准确性和特异性。


免疫细胞浸润分析:

通过ssGSEA分析发现,在肺纤维化患者中,激活的B细胞、CD4 T细胞等免疫细胞的比例更高,且关键基因与多种免疫细胞的浸润呈正相关或负相关。


亚型识别和免疫浸润差异分析:

通过共识聚类分析将肺纤维化患者分为两个亚型,并发现不同亚型间免疫细胞浸润存在显著差异。


关键基因的功能验证:

通过Western blot和动物模型实验,验证了PHACTR1基因敲除可以减少肺组织炎症和胶原沉积,抑制TGF-β诱导的α-SMA和胶原表达。


这篇文章通过整合单细胞测序和机器学习技术,深入解析了肺纤维化的细胞和分子机制,并开发了一个新的诊断模型,为肺纤维化的精准医疗提供了新的视角和工具。


 研究结果 


Fig 1 肺纤维化样本中的细胞注释和亚型鉴定


Fig 2 肺纤维化中的差异基因表达和通路分析


Fig 3 机器学习分析和关键基因交集


Fig 4 诊断模型验证和表现评估


Fig 5 关键基因表达和诊断模型功效的外部验证


Fig 6 肺纤维化中的免疫细胞浸润


Fig 7 亚型识别和免疫浸润差异


Fig 8 体内和体外实验中的关键基因表达验证


雪球老师,您在开头说的“做进化”我听着不太摸得到头脑。就拿这篇文章来说,具体能怎么做呢?

就拿机器学习这个我们一直在介绍、使用和教学的套路来说,基于基本的几大算法做组合,优中选优,对咱们来说都不算新鲜事了,但是本质上都是不能让研究者、审稿人,以及临床实践中的医患双方明白建立的模型中,哪些特征更重要、哪些特征是正向贡献,等等。这时候就可以进化为“ SHAP解释”,让模型内特征的作用一目了然。打个比方,就是看清楚一份小组作业中,谁功劳大、谁拖后腿,这些。更多拓展内容,添加雪球好友后,通过朋友圈、直播答疑等等,我们慢慢讲。







生信发文不建议守株待兔,但生信学习的这只兔——雪球老师,你可别错过!雪球老师是复旦大学中山医院病理科博士,具有超过10年的医学科研经验,发表过12篇SCI、5篇中文核心,已陪跑超过5000个生信和临床项目,培养300+硕博顺利毕业,从业经历超过6年。雪球老师作为主教练,携精英团队推出的生信学习+实战精品课程——卓越计划,将把能发文、能拓展联合、能实用上分的各大生信套路,系统教给大家。现在报名,即刻预习,3月开课


✅️三个月大体量直播课,通关实用生信套路

✅️两天线下实地纠错,生信分析实操跟练

✅️高品质生信分析成长,添加雪球回复“卓越计划”了解


3月,对你而言,是研究生新学期的开始、毕业的临近,还是国自然标书修改提交的尾声?紧锣密鼓,雪球老师今晚八点推出放大标书申请成功率重量级主题。参加方法请扫码添加雪球老师,回复“1”获取!

雪球的生信套路 每周周中更新

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/179531
 
176 次点击