社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

IF=10.7!纯公共数据的病理组学+深度学习!0自测低成本的风,还是刮到了病理组学

挑圈联靠 • 1 月前 • 41 次点击  

欢迎来看雪球讲套路、讲文献!劳动节小长假还没结束时,一篇竟然选取了男性患者的子宫肌瘤论文,映射出医学科研发文过程中代笔写作、同行评审、期刊校对多流程的混乱。想走捷径,一朝被曝,反陷学术不端的舆论漩涡。


2025年,没人脉没资源的普通人怎么发文?

方法很多,生信分析或者临床队列研究都有新招。


比如这篇文献仅使用TCGA中的组织病理学图像,没花一分钱找样本、做实验,依然发到IF10+的医学影像顶级期刊,不靠花招,而是搭对、搭好了时代顺风车——


深度学习,也能分析病理组学了

都是高通量数据

交给计算机方法,正好对口


Ensemble transformer-based multiple instance learning to predict pathological subtypes and tumor mutational burden from histopathological whole slide images of endometrial and colorectal cancer

基于集成变换器的多实例学习从子宫内膜癌和结直肠癌的组织病理学全玻片图像中预测病理亚型和肿瘤突变负荷


期刊:Medical Image Analysis

IF:10.7

发布时间:2025/01


 深度学习在本研究中的优势? 


肿瘤突变负荷(TMB)作为一种基因组生物标志物逐渐受到关注。高TMB的特点为大量编码异常的肿瘤新抗原的基因突变,对免疫治疗反应更好。因此,部分与高 TMB 相关的 EC 和 CRC 患者可能有更高的机会接受免疫治疗。


然而,TMB如果通过测序评估(全外显子组测序,或二代测序),成本高昂,难以在所有临床病例中广泛应用。因此,需要一种有效、高效、低成本且易于访问的工具来区分 EC 和 CRC 患者的 TMB 状态。


可解释机器学习/人工智能/多模态

在Nature及其子刊中尤其火热哦~


 技术路线 


数据预处理:

从TCGA平台下载全玻片图像(WSIs),应用RandAugment进行数据增强,以提高组织病理学中的领域泛化能力。


视觉补丁分割模块(VPSM):

从WSIs中快速提取非重叠的前景补丁,以提高效率和准确性。


自监督学习视觉Transformer特征编码器模块(SSLViT):

通过自监督学习策略训练视觉Transformer编码器,以提取有效的图像特征表示。


集成Transformer基础的多实例学习模块(ETMIL):

利用Transformer结构的多实例学习模块,通过注意机制提取最具判别性的实例特征;通过实例级和袋级注意机制进行特征选择和融合,以提高预测性能。


预测模块:

通过全连接层和Softmax函数进行分类预测,输出病理亚型和TMB状态的预测结果。


模型训练和运行时分析:

采用交叉熵损失函数和Lookahead优化器与RAdam优化器相结合。

在配备NVIDIA GTX 1080 Ti GPU的工作站上进行模型训练和测试。

实现高效的训练和推理时间,使该方法适用于临床实践。


结果评估:

在两个不同的癌症队列上评估框架,包括来自TCGA的529名EC患者的918张组织病理学WSIs和594名CRC患者的1495张WSIs,用于预测癌症亚型和TMB状态。



 研究结果 


Fig 2 受试者工作特征曲线下面积(AUROC曲线),用于评估(a) EC 亚型分类(侵袭性与非侵袭性),(b) 侵袭性 EC 亚型中的 TMB 预测 (c) 非侵袭性 EC 亚型中的 TMB 预测


Fig 3 AUROC曲线,用于评估 (a) CRC 亚型分类(粘液性与非粘液性),(b) 非粘液性 CRC 亚型中的 TMB 预测,(c) 粘液性 CRC 亚型中的 TMB 预测


Fig 4 两种癌症数据集的数据信息


Fig 5 在预测(a) CRC TMB和(b) EC TMB时对注意力热图进行建模







这篇文献还有一个细节——硬件上的亮点,研究团队强调了使用价格低廉的GPU卡(GTX 1080Ti),即可有效提取特征大小为原始 WSI 6% 的特征,训练时间不到 3 小时,推理时间不到 30 秒。


在进行生物信息学分析时常常苦恼的计算机硬件、代码学习门槛等问题,看似难以攀越,如果能有导师引路,进行方法学的优化、知识的系统性梳理,也能逐一化解。


雪球老师带队,基于成功陪跑5000+科研项目的丰富经验,以及名校硕博团队的强劲实力,针对医学硕博毕业缺实验经费、缺知识梳理、缺发文规划等重难点,推出硕博学位陪跑计划,有知识、有技能、有趁手工具,有大小论文陪跑......陪你告别毕业困难!


添加雪球老师后可回复“硕博”咨询


雪球老师每周三晚八点,也会直播讲解生信/临床研究发文的诀窍。深度拆解、集中梳理,原本难以跨越的3+、5+,一二区门槛,其实没有那么可怕。想要了解新鲜发文动向,添加雪球回复“1”,进群预约,收获课件吧~

 雪球的生信套路 每周周中讲解 

注意没有星标⭐的话

容易错过更新哦

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/181852
 
41 次点击