Py学习  »  机器学习算法

顶刊速读:Commun Med 可解释的多模态机器学习框架揭示了远端感觉运动多发性神经病变的病理特征

AI与医学 • 7 月前 • 140 次点击  

点击👆蓝字或👇名片,关注"AI与医学"




类型:超精简版

选文: 大壮

编辑: 小黄


最近听到一首歌,很应景啊,每到年关感慨良多。

歌词:

一句先苦后甜,我熬了一年又一年

曾经一腔热血的少年,如今变得沉默寡言........


人过30后,感觉时间就很快,青春真的短暂,只有加倍努力。其实以前也超努力,上学时玩一天都有负罪感,要么去图书馆,要么去打工,要么去实验室,也常睡实验室,不敢浪费一点时间。第一份工作有很多不会,就规定学到12点回去。总是觉得自己笨,就要多学一会,多做一点。绝对是合格小牛马。但总为什么感觉混的不好呢

可能是方向不对。

也可能是命不好

最近一直思考这个问题,命运是玄学很难左右,能做的是保持乐观,当原地踏步时候调整一下方向。


不扯淡了,言归正传。


临床数据是一个大问题,

如何构建高效临床数据库?

如何构建高效的AI研究平台?

不少医院成立大数据中心、AI中心,研究如何高效通过大数据助理临床科研,赋能诊断。


大壮搞AI8个年头了,世界五百强都干了三家了。有一些心得和体会。后面讲讲点这一块的东西,毕竟论文太枯燥,大家不感兴趣。


不感兴趣也要讲的,毕竟这个号的使命就是宣传和介绍AI与医学科研,不能忘记初心。


Nguyen, Phong B H et al. “Interpretable multimodal machine learning (IMML) framework reveals pathological signatures of distal sensorimotor polyneuropathy.” Communications medicine vol. 4,1 265. 16 Dec. 2024, doi:10.1038/s43856-024-00637-1



概念介绍

弹性网络模型(Elastic Net)是一种结合了L1和L2正则化的线性回归模型,旨在解决高维数据中的特征选择和多重共线性问题。它通过引入两个正则化参数λ(控制惩罚项的总体强度)和ρ(控制L1和L2惩罚项的相对比例),在Lasso回归(侧重于特征选择,产生稀疏模型)和岭回归(侧重于所有特征的平衡压缩)之间进行调节。


0.前言

      远端感觉运动多发性神经病变(DSPN)是老年人、肥胖者以及糖尿病前期和糖尿病患者中常见的一种神经疾病,与高发病率和早逝有关。DSPN是一种多因素疾病,目前尚未完全理解。

1.研究简介

1.1研究目的:

  • 研究人员开发了一个可解释的多模态机器学习(IMML)框架,用于基于稀疏多模态数据预测DSPN 的患病率和发病率。

  • 利用IMML的可解释性进一步增强了生物标志物的识别能力。


1.2研究方法

  • 研究使用了来自KORA平台的基于人群的数据,并使用 MNSI评分的检查部分来评估所有参与者的 DSPN 状态。

  • 获得的六种类型的分子数据进行预处理和划分。

  • 进行特征选择模型训练

  • 比较机器学习算法并对模型进行优化。

  • 进行患病率预测和发病率预测。

2 研究结果

研究基于人群的 KORA 研究数据,包括年龄在 62-81 岁之间的参与者,并对参与者进行了 DSPN 的临床检查。

2.1两步特征选择和集成机器学习框架

  • 特征工程和选择

    i.使用 849 个至少缺少一种数据模态的样本来丰富生物学信号和减少特征空间,而完全表征的 242 个样本则专门用于最终模型训练.

    ii.优先选择预测性和生物学相关的生物分子,不考虑其效应大小。

  • 最终模型训练和多模态数据整合

    i.比较了三种特征整合方法,发现 GSEA-FFS 表现最佳,其次是 GSEA-集成堆叠。

    ii.比较了弹性网、随机森林和支持向量机的预测性能,通过 100 次匹配重采样和前向特征选择,发现弹性网优于其他三种算法.

    iii.在每次重采样的迭代中,基于交叉验证选择最具预测性的模态组合,最终模型分析返回的预测模态组合将用于后续部分的 DSPN 分类和发病率预测的功能分析.



2.2临床数据足以区分有无 DSPN 的个体

  • 使用临床数据构建的模型能够有效区分 DSPN 病例和对照组,模型的 AUROC 值为 0.752,表明临床数据具有较好的预测性能。

  • 通过弹性网模型和稳健排名聚合方法,提取出 13 个预测性临床特征。在这些特征中,年龄、腰围、身高和是否患有神经系统疾病对 DSPN 预测的影响最大。

  • 利用主成分分析(PCA)对这四个关键临床变量进行分析,结果显示它们能够有效分离 DSPN 病例和对照组。

  • 在对测试集样本进行预测时,大多数 DSPN 病例的预测概率高于对照组。病例组的年龄、腰围和身高值显著高于对照组,而神经系统疾病在 DSPN 病例中显著富集。


2.3分子数据提高了 DSPN 发病率预测的准确性

  • 仅使用临床数据作为基线模型时,AUROC 为 0.603,预测性能有限。随着分子模态数量的增加,AUROC 为 0.714,已达到较好的预测效果,进一步增加模态对性能提升有限。

  • 在最终的三模态模型中,共有 26 个特征具有非零 t 统计量,包括 17 个炎症蛋白、4 个代谢物、3 个转录本和 2 个临床变量,这些特征共同作用提高了 DSPN 发病率的预测准确性。

  • 炎症蛋白是最先被选中的分子层,对 DSPN 发病率预测的贡献最大,其次是代谢物,而 SNPs(单核苷酸多态性)携带的预测信息最少。


2.4炎症增加、SUMOylation 水平降低和必需脂肪酸水平降低是 DSPN 发病的重要标志

  • 在预测 DSPN 发病的模型中,27 个最重要的特征中有 18 个是炎症蛋白,表明炎症在 DSPN 发病过程中起着关键作用。

  • SUMOylation 相关信号通路的下调在 DSPN 发病中具有显著性,涉及 DNA 复制和 DNA 损伤响应修复等过程,提示 SUMOylation 在疾病发展中的潜在影响。

  • 三个必需脂肪酸(caprate、linolenate 和 adrenate)在 DSPN 发病中显著下调,这些脂肪酸与神经功能和炎症调节有关,其水平变化可能与 DSPN 的发病机制相关。

3.结语

(1)研究揭示了炎症、SUMOylation 和必需脂肪酸等在 DSPN 发病中的重要作用,这说明了需要从多因素、多层面的角度进行综合分析和研究,这有助于全面把握疾病本质,为后续研究和临床实践奠定基础。

(2)论文为 DSPN 的风险评估提供了新思路,通过整合临床和分子数据,可以更准确地识别高风险人群。这为制定个性化的预防策略提供了依据。


感谢您的阅读,如果您对这项研究感兴趣或想了解更多关于AI在医学中的应用,请继续关注我们,我们会定期分享最新的科研成果和健康资讯。别忘了点赞和转发哦!👍🔄


广告

快来看,大壮卖艺,提供医工交叉科研服务



— THE END —

排版:大壮

美工:大壮

注:本文仅用于分享和研究AI与医学相关学术论文

如存在侵权,请告知,及时删





往期推文

顶刊速看:Nature Med 基于AI和超声的卵巢癌检测:一项国际多中心研究

顶刊速看:IF=9.4 基于影像组学的体成分分析在肝细胞癌患者1年生存预后中的作用

香港理工:EyeGPT—眼科专属大模型

顶刊速读:《Brain》 抑郁症的大尺度病变症状映射识别风险和韧性能力大脑区域

往期内容

抽奖送书!!!MICCI2024 RoCoSDF:基于AI的手持超声成像三维重建

顶刊速看:《JAMA Network Open》IF=10.5 基于人工智能的皮瓣监测系统

顶刊速看:NC IF=14.7 基于深度学习心电图和人工概念特征融合的先天性心脏病检测研究

顶刊速看:NC IF=14.7 通过深度学习揭示左心房结构与心房颤动风险的联系

顶刊快看:Radiology 基于CT和AI在非小细胞肺癌节段切除术预后模型研究

顶刊快看:NatMed=82.9 基于多队列改进心血管风险预测新算法开发和验证

顶刊快看:Cell Report Medicine IF=14.3 AI在前列腺癌管理中的革命性应用 - 最新研究进展

顶刊快看:NatMed=82.9 母亲糖尿病与后代注意力缺陷/多动障碍(ADHD)风险之间的关系:基于360万母子队列数据

顶刊快看:NC IF=16.6 基于可解释机器学习的骨关节炎亚组生物标志物分析和风险预测

顶刊快看:NC IF=16.6 眼泪也可以检测血糖?使用无线智能隐形眼镜深入分析泪液葡萄糖和血糖之间的相关性



Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/177893
 
140 次点击