社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

IF=17.0!复旦大学团队蛋白组学+机器学习发表Nature子刊

统计之光科研时间 • 1 月前 • 255 次点击  

引言

疾病是一个动态过程,在进行早期生物标志物的分析时,一定要对疾病机制进行动态轨迹分析,才能避免我们的研究仅仅停留在“相关性”上。

帕金森病(PD),是最常见的运动障碍。其有一个漫长的前驱期,只有当相当比例的受影响神经元已经退化时,PD 的临床体征和症状才会出现。在这个漫长的阶段,并不会出现任何症状,只有生物标志物才能在正式诊断之前提供对疾病的洞察。

4月5日,复旦大学研究团队在Nature子刊《Nature Aging》(IF=17.0)上发表研究论文,聚焦帕金森病(PD)早期病理机制与生物标志物开发,采用“蛋白筛选-功能解析-时序建模-临床关联-因果验证-预测建模”的系统性框架,首次揭示了PD脂质代谢异常等前驱病理特征。

该研究思路清晰、方法多维,形成了从机制探索到临床应用的完整证据链,方法创新性很强!

文献简介



文献标题:帕金森病的大规模蛋白质组学分析揭示了新的病理生理学见解和潜在的生物标志物


期刊名称:Nature Aging


影响因子:17.0,中科院1区Top


发表时间:2025年4月5日

💡  PMID:39979637

扫码添加客服微信,回复【PDF】

提交文章截图,免费领取文献PDF原文


研究背景 Background


帕金森病(PD)是一种神经退行性疾病,其早期病理生理机制尚不明确,且缺乏有效的早期诊断标志物。现有研究多集中于有症状患者,而疾病的无症状阶段(前驱期)的蛋白质组动态变化尚未被充分揭示。此外,多数蛋白质组学研究为横断面设计,难以捕捉疾病发展的时间序列变化。

本研究利用英国生物银行(UK Biobank)的大规模血浆蛋白质组数据(Olink平台检测2,920种蛋白质)和长期随访(中位14.45年),旨在揭示PD发病前15年的血浆蛋白质动态变化,识别潜在生物标志物,并探索其与PD前驱症状、脑结构及遗传机制的关联。

思 路


1️⃣全蛋白质组关联分析:通过Cox比例风险模型筛选与PD发病显著相关的蛋白质。

2️⃣功能富集与网络分析:解析PD相关蛋白质的生物学功能及相互作用。

3️⃣时间动态轨迹建模:使用LOESS平滑分析蛋白质水平在诊断前15年的变化趋势。

4️⃣临床关联分析:探究蛋白质与PD前驱症状(如RBD、便秘)及脑结构的关联。

5️⃣孟德尔随机化(MR):评估蛋白质对PD的因果效应。

6️⃣机器学习预测模型:整合蛋白质与人口学特征构建PD风险预测模型。


研究步骤 Research Steps


1

全蛋白质组关联分析

首先使用Cox比例风险模型,调整年龄、性别、种族等混杂因素,分析2,920种血浆蛋白质与PD发病风险的关联。

通过Bonferroni校正(P<1.71×10⁻⁵)筛选显著关联的蛋白质。

Cox模型适用于生存数据(含时间-事件关系),可处理随访时间差异和删失数据;Bonferroni校正控制多重检验假阳性。

从数据中可以看到全随访期、5年内及5年后的蛋白质关联结果。ITGAV、BAG3等蛋白在多个时间段均显著。

HR<1表示保护效应(如ITGAV水平升高与风险降低相关),HR>1为风险效应(如NEFL水平升高与风险增加相关)。

结论:

🟣鉴定出38个与PD显著相关的蛋白质(如ITGAV、HNMT、ITGAM),其中6个(如BAG3、CLEC10A)在外部队列(PPMI)中验证。

🟣ITGAV的关联最强(HR=0.11, P=6.90×10⁻²⁴),其水平升高显著降低PD风险。

2

功能富集与蛋白质互作网络

使用STRING数据库构建蛋白质-蛋白质互作(PPI)网络,通过GO和Reactome富集分析揭示生物学通路,解析PD相关蛋白质的生物学功能及协同作用机制。

结论:

🟣蛋白质分为6类功能模块,包括免疫反应(如ITGAM)、细胞外基质组织(如ITGAV)、神经分泌(如VGF)。

🟣脂质代谢和TGF-β信号通路在长期风险中富集,多巴胺代谢在短期风险中显著。

🟣免疫和代谢通路异常提示PD早期外周病理可能通过炎症和代谢失调驱动中枢神经退变。

3

蛋白质时间动态轨迹分析

LOESS适合非参数时间趋势分析,可以揭示蛋白质动态变化模式。作者使用LOESS平滑模型,分析了PD诊断前15年的蛋白质Z值变化,定义异常阈值(|Z|≥0.3)。

结论:

🟣HPGDS(脂质代谢相关)在诊断前15年即异常降低,并持续至发病。

🟣BAG3、ITGAV在诊断前12年开始下降,而NEFL(神经丝轻链)在诊断前5年显著升高。

🟣脂质代谢异常最早出现,神经退变标志物(如NEFL)后期升高,提示PD病理的时序演变。

4

PD前驱症状及脑结构关联分析

为了验证蛋白质的临床意义及脑病理关联,作者通过Cox模型评估蛋白质与前驱症状(如RBD、便秘)的关联;线性回归模型分析蛋白质与脑结构体积/厚度的关联。

结论:

🟣ITGAM与RBD风险正相关,与便秘风险负相关;ITGAV降低尿失禁风险。

🟣ITGA11、HPGDS与海马旁回厚度正相关。

🟣外周蛋白质变化与前驱症状及脑萎缩相关,支持“肠-脑轴”和神经炎症假说。

5

孟德尔随机化与预测模型

使用cis-pQTL作为工具变量,孟德尔随机化(MR) 分析蛋白质与PD的因果关系,可解决反向因果关系。

机器学习(LightGBM)构建16蛋白质+人口学的预测模型,通过整合多变量优化预测性能。

结论:

🟣ITGAM和EGFR可能为PD的因果风险因素

🟣模型AUC=0.887(5年内预测),优于纯人口学模型(AUC=0.752)。外部验证(PPMI)AUC=0.802,NEFL、VGF和PEPD为关键预测因子。

🟣整合蛋白质和人口学特征显著提升预测效能,NEFL为最强预测因子(SHAP值最高)。

小结

这项研究利用UK Biobank等大型队列的多组学数据,用长期随访数据结合时间序列建模(LOESS)揭示了疾病的动态变化,弥补了横断面研究的不足。

未来研究也可借鉴【多维数据整合、动态时序分析、因果推断与预测模型的结合】这一框架,应用于阿尔茨海默病、肌萎缩侧索硬化症等复杂神经退行性疾病的探索。

扫码添加客服微信,回复【PDF】

提交文章截图,免费领取文献PDF原文


如果你对于生信分析的高阶技巧还不够熟练,还不懂怎么结合大型队列进行纵向设计,强烈建议来【统计之光生信分析一对一全流程教学指导】。专业的生信分析老师将从0开始指导你学习生信分析技巧,带你将一个全新的课题落地,结课即投稿!效率拉满🚀

01


从0到1,全程定制


基于学员的选题而定制化安排授课内容。全程从0到1,真正做到独一无二专属定制,不用担心选题再踩坑!

02


在线指导,随时答疑


1V1腾讯会议定制授课,在直播中,学员可以通过发送弹幕和老师实时互动,老师在讲课时可以根据学员的弹幕反馈来及时调整自己的讲课节奏。

1V1专属项目群答疑,课上学、课下练,争取让你每一次的疑问都能得到解答。

03


永久回放,保障学习


教学过程讲师会全程录屏,课后一小时内就会上传到学员专属后台,学员可根据需求随时随地进行回放学习,超清视频回放长期有效!

04


专属服务,贴心陪伴


除了项目内各环节授课以外,我们提供的语言服务、选刊投稿指导、返修指导等服务环节也都是学员专属一对一服务。由团队内专业的老师一对一和学员对接,共同推进项目落地,环环相扣,全程高效。

05


自建数据库,支付级安全系统


自建项目管理系统,所有交付文件均存放于自建数据库,保障信息安全。报名签订保密协议,开具公司发票,安心可靠!

一对一全流程培训服务特色 


🌟 服务内容:从选题→教学→成稿后专家评估→根据专家建议返修→翻译润色→选刊投稿全程指导,结课之时,掌握技能+拥有成果。

🌟 教学模式:一对一直播教学,不受时空限制,学员可灵活约课,提供永久超清视频回放。

🌟 安全保障:签订保密协议,公司自建数据管理系统(基于NAS),内容均无法外流。

🌟 团队力量:除讲师外,还配备资深助教、教务、专业编辑,“多对一”模式全方位协助解决学习问题。

🌟 赠送权益:赠送统计之光VIP一年,可免费学习数十门科研筑基训练营


立即扫码

免费咨询统计之光一对一SCI服务

👇👇👇





 END 

统计之光专注于提供医学SCI教学指导:

Meta分析一对一

经典Meta、网状Meta、预测模型Meta、放射组学Meta、伞状Meta、影像组学Meta等全种类Meta、医学全科可学!

临床研究一对一

SEER数据库挖掘、MIMIC数据库挖掘、NHANES数据库、GBD数据库挖掘、基于现有数据设计课题及指导分析、指导收集数据进行临床研究、多中心临床试验等各类临床研究!

生信分析一对一

各类生信分析1-3分、3-6分、6+的课题设计及教学指导,孟德尔随机化教学指导、单细胞测序研究等各类生信服务!

不定期发布高品质视频课:

1️⃣ GBD数据库零基础挖掘实战

2️⃣ MIMIC数据库挖掘从0产出一篇论文

3️⃣ 孟德尔随机化实战课题落地

4️⃣ 单细胞生信分析全流程

5️⃣ Meta分析小白消除计划

6️⃣ 生信全能实战班

7️⃣ Meta分析选题秘籍

8️⃣ AI浪潮下,如何优雅完成SCI写作(待开

9️⃣GBD直播课(待开)


一对一单项高品质科研服务:

01

生物医学领域论文翻译、母语润色服务

02

专家评审服务,让研究设计更具科学性

03

选刊投稿服务,精准投稿,提高文章接收率

04

统计分析服务,从方案到成果保障可靠

往期精彩

GBD 2023马上来了!公开数据预计今年5月发布!

学员喜报合集,热烈祝贺新鲜出炉的部分统计之光学员成功发表SCI!

统计之光年中总结丨2025进度■■■□□□,活力■■■■■■

助力全球学者科研成长

统计之光STATRAY

统计之光是沿长控股旗下的技能培训品牌。依托资深技术大牛团队+互联网平台,致力于打造以“浓缩、易懂、专业、实用、定制”为服务特色的互联网知识工具,为全球学者提供靠谱的统计技能学习解决方案。

我们相信:好的产品自己能说话

——统计之光创始人Borra

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/182036
 
255 次点击