社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

IF=6.1,2区Top,生信老朋友!不想加湿实验又想发高分,单细胞+机器学习应该怎样升级?

挑圈联靠 • 3 月前 • 90 次点击  

欢迎来看雪球讲套路、讲文献!昨天雪球带大家读了一篇构建预后预测模型的6+文献,今天雪球就“端水”一下,为大家讲解一篇诊断模型的6+SCI,同样是构建具有临床意义的模型,两篇文章的思路和分析技术可不相同。跟雪球一起来精读这篇文献吧!


别看这篇文章使用了单细胞+机器学习的分析,就觉得硬件要求、代码能力门槛高,不敢上手做。随着开源工具的增加,以前咱们觉得特别高大上的分析,纷纷都更好上手了。打好基础后,凭借这些经典套路的延展性,做进化,也能有效上分。

零基础?基础薄弱?寻求进步?不敢上手做?

来试试雪球团队沉淀的普通人也学得会的内训模型

添加雪球回复“卓越计划”详细了解



添加雪球后回复“1

进群跟紧干货直播,更有好礼相送

不怕没时间,错过可以看回放!


Deciphering the cellular and molecular landscape of pulmonary fibrosis through single-cell sequencing and machine learning

通过单细胞测序和机器学习解读肺纤维化的细胞和分子图谱


期刊:Journal of Translational Medicine

IF:6.1

发布时间:2025/01/02


 技术路线 


数据获取:

从GEO数据库中收集了GSE110147、GSE213001、GSE136831和GSE150910等数据集,为肺纤维化的研究提供了基因表达数据。


单细胞测序数据预处理:

使用Cellranger软件对原始数据进行处理,包括比对、过滤、条形码校正和UMI计数,以及使用Seurat进行数据集成,消除批次效应。


细胞聚类和注释:

使用UMAP方法将高维数据映射到二维空间,根据基因表达模式将细胞分为七种类型,包括B细胞、树突细胞、内皮细胞、上皮细胞、巨噬细胞、NK细胞和平滑肌细胞。


差异表达基因(DEGs)分析:

通过比较分析,识别出1104个差异基因,并与巨噬细胞相关基因集合交集,得到20个与巨噬细胞相关的肺纤维化差异基因。


功能富集分析:

GO分析显示这些基因主要涉及转录因子活性的调控等生物学功能;KEGG分析显示这些基因主要富集在PI3K-Akt信号通路等路径中。


构建肺纤维化诊断模型:

通过随机森林分析等方法,确定了与诊断密切相关的三个关键基因TMEM52B、PHACTR1和BLVRB,并构建了具有高准确性和最小误差的诊断模型。


诊断模型的验证:

使用外部数据集对关键基因的表达进行验证,并通过ROC曲线分析证明了模型的高准确性和特异性。


免疫细胞浸润分析:

通过ssGSEA分析发现,在肺纤维化患者中,激活的B细胞、CD4 T细胞等免疫细胞的比例更高,且关键基因与多种免疫细胞的浸润呈正相关或负相关。


亚型识别和免疫浸润差异分析:

通过共识聚类分析将肺纤维化患者分为两个亚型,并发现不同亚型间免疫细胞浸润存在显著差异。


关键基因的功能验证:

通过Western blot和动物模型实验,验证了PHACTR1基因敲除可以减少肺组织炎症和胶原沉积,抑制TGF-β诱导的α-SMA和胶原表达。


这篇文章通过整合单细胞测序和机器学习技术,深入解析了肺纤维化的细胞和分子机制,并开发了一个新的诊断模型,为肺纤维化的精准医疗提供了新的视角和工具。


 研究结果 


Fig 1 肺纤维化样本中的细胞注释和亚型鉴定


Fig 2 肺纤维化中的差异基因表达和通路分析


Fig 3 机器学习分析和关键基因交集


Fig 4 诊断模型验证和表现评估


Fig 5 关键基因表达和诊断模型功效的外部验证


Fig 6 肺纤维化中的免疫细胞浸润


Fig 7 亚型识别和免疫浸润差异


Fig 8 体内和体外实验中的关键基因表达验证


雪球老师,您在开头说的“做进化”我听着不太摸得到头脑。就拿这篇文章来说,具体能怎么做呢?

就拿机器学习这个我们一直在介绍、使用和教学的套路来说,基于基本的几大算法做组合,优中选优,对咱们来说都不算新鲜事了,但是本质上都是不能让研究者、审稿人,以及临床实践中的医患双方明白建立的模型中,哪些特征更重要、哪些特征是正向贡献,等等。这时候就可以进化为“ SHAP解释”,让模型内特征的作用一目了然。打个比方,就是看清楚一份小组作业中,谁功劳大、谁拖后腿,这些。更多拓展内容,添加雪球好友后,通过朋友圈、直播答疑等等,我们慢慢讲。







生信发文不建议守株待兔,但生信学习的这只兔——雪球老师,你可别错过!雪球老师是复旦大学中山医院病理科博士,具有超过10年的医学科研经验,发表过12篇SCI、5篇中文核心,已陪跑超过5000个生信和临床项目,培养300+硕博顺利毕业,从业经历超过6年。雪球老师作为主教练,携精英团队推出的生信学习+实战精品课程——卓越计划,将把能发文、能拓展联合、能实用上分的各大生信套路,系统教给大家。现在报名,即刻预习,3月开课


✅️三个月大体量直播课,通关实用生信套路

✅️两天线下实地纠错,生信分析实操跟练

✅️高品质生信分析成长,添加雪球回复“卓越计划”了解


3月,对你而言,是研究生新学期的开始、毕业的临近,还是国自然标书修改提交的尾声?紧锣密鼓,雪球老师今晚八点推出放大标书申请成功率重量级主题。参加方法请扫码添加雪球老师,回复“1”获取!

雪球的生信套路 每周周中更新

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/179531
 
90 次点击