欢迎来看雪球讲套路、讲文献!昨天雪球带大家读了一篇构建预后预测模型的6+文献,今天雪球就“端水”一下,为大家讲解一篇诊断模型的6+SCI,同样是构建具有临床意义的模型,两篇文章的思路和分析技术可不相同。跟雪球一起来精读这篇文献吧!
别看这篇文章使用了单细胞+机器学习的分析,就觉得硬件要求、代码能力门槛高,不敢上手做。随着开源工具的增加,以前咱们觉得特别高大上的分析,纷纷都更好上手了。打好基础后,凭借这些经典套路的延展性,做进化,也能有效上分。
零基础?基础薄弱?寻求进步?不敢上手做?
来试试雪球团队沉淀的普通人也学得会的内训模型
添加雪球回复“卓越计划”详细了解
添加雪球后回复“1”
进群跟紧干货直播,更有好礼相送
不怕没时间,错过可以看回放!
Deciphering the cellular and molecular landscape of pulmonary fibrosis through single-cell sequencing and machine learning
通过单细胞测序和机器学习解读肺纤维化的细胞和分子图谱
期刊:Journal of Translational Medicine
IF:6.1
发布时间:2025/01/02
数据获取:
从GEO数据库中收集了GSE110147、GSE213001、GSE136831和GSE150910等数据集,为肺纤维化的研究提供了基因表达数据。
单细胞测序数据预处理:
使用Cellranger软件对原始数据进行处理,包括比对、过滤、条形码校正和UMI计数,以及使用Seurat进行数据集成,消除批次效应。
细胞聚类和注释:
使用UMAP方法将高维数据映射到二维空间,根据基因表达模式将细胞分为七种类型,包括B细胞、树突细胞、内皮细胞、上皮细胞、巨噬细胞、NK细胞和平滑肌细胞。
差异表达基因(DEGs)分析:
通过比较分析,识别出1104个差异基因,并与巨噬细胞相关基因集合交集,得到20个与巨噬细胞相关的肺纤维化差异基因。
功能富集分析:
GO分析显示这些基因主要涉及转录因子活性的调控等生物学功能;KEGG分析显示这些基因主要富集在PI3K-Akt信号通路等路径中。
构建肺纤维化诊断模型:
通过随机森林分析等方法,确定了与诊断密切相关的三个关键基因TMEM52B、PHACTR1和BLVRB,并构建了具有高准确性和最小误差的诊断模型。
诊断模型的验证:
使用外部数据集对关键基因的表达进行验证,并通过ROC曲线分析证明了模型的高准确性和特异性。
免疫细胞浸润分析:
通过ssGSEA分析发现,在肺纤维化患者中,激活的B细胞、CD4 T细胞等免疫细胞的比例更高,且关键基因与多种免疫细胞的浸润呈正相关或负相关。
亚型识别和免疫浸润差异分析:
通过共识聚类分析将肺纤维化患者分为两个亚型,并发现不同亚型间免疫细胞浸润存在显著差异。
关键基因的功能验证:
通过Western blot和动物模型实验,验证了PHACTR1基因敲除可以减少肺组织炎症和胶原沉积,抑制TGF-β诱导的α-SMA和胶原表达。
这篇文章通过整合单细胞测序和机器学习技术,深入解析了肺纤维化的细胞和分子机制,并开发了一个新的诊断模型,为肺纤维化的精准医疗提供了新的视角和工具。
雪球老师,您在开头说的“做进化”我听着不太摸得到头脑。就拿这篇文章来说,具体能怎么做呢?
就拿机器学习这个我们一直在介绍、使用和教学的套路来说,基于基本的几大算法做组合,优中选优,对咱们来说都不算新鲜事了,但是本质上都是不能让研究者、审稿人,以及临床实践中的医患双方明白建立的模型中,哪些特征更重要、哪些特征是正向贡献,等等。这时候就可以进化为“
SHAP解释”,让模型内特征的作用一目了然。打个比方,就是看清楚一份小组作业中,谁功劳大、谁拖后腿,这些。更多拓展内容,添加雪球好友后,通过朋友圈、直播答疑等等,我们慢慢讲。
生信发文不建议守株待兔,但生信学习的这只兔——雪球老师,你可别错过!雪球老师是复旦大学中山医院病理科博士,具有超过10年的医学科研经验,发表过12篇SCI、5篇中文核心,已陪跑超过5000个生信和临床项目,培养300+硕博顺利毕业,从业经历超过6年。雪球老师作为主教练,携精英团队推出的生信学习+实战精品课程——卓越计划,将把能发文、能拓展联合、能实用上分的各大生信套路,系统教给大家。现在报名,即刻预习,3月开课!
✅️三个月大体量直播课,通关实用生信套路
✅️两天线下实地纠错,生信分析实操跟练
✅️高品质生信分析成长,添加雪球回复“卓越计划”了解
3月,对你而言,是研究生新学期的开始、毕业的临近,还是国自然标书修改提交的尾声?紧锣密鼓,雪球老师今晚八点推出放大标书申请成功率重量级主题。参加方法请扫码添加雪球老师,回复“1”获取!