2型糖尿病(T2D)作为一种主要的全球健康问题,常导致多种并发症,其中冠心病(CHD)是T2D患者面临的关键风险之一,其发病率较非糖尿病人群高出两至四倍,显著增加了患者的死亡率。蛋白质作为基因与环境复杂相互作用的产物,其在预测疾病发生方面具有更大潜力。然而,目前尚不清楚影响 T2D 发展的蛋白质分子是否也可以作为CHD发生的预测标志物。Cardiovascular Diabetology 上发表的新文章利用公共蛋白质组学数据,成功识别了T2D和CHD共有的蛋白质标志物,并构建了有效的预测模型,为T2D患者中CHD的早期预测和干预提供了新的生物标志物和治疗靶点。
标题:Proteomic signatures of type 2 diabetes predict the incidence of coronary heart disease
期刊:Cardiovascular Diabetology(IF 8.5)
出版商:BioMed Central
发表:2025年3月14日
DOI:https://doi.org/10.1186/s12933-025-02670-3
关键词:2型糖尿病 | 冠心病 | 蛋白质组学 | 孟德尔随机化 | 预测模型 | 治疗药物
技术手段:蛋白质组、MR、机器学习算法、PPI分析、功能富集分析等
核心思路:
数据来源:从UKB数据库获取了2923种血浆蛋白质数据以及T2D和CHD的相关数据;从Icelandic数据库获取了35559名参与者和4907种血浆蛋白质的pQTL数据;从FinnGen consortium获取了T2D和CHD患者的基因组数据。
蛋白质组学分析:在Olink Explore 3072平台上利用基线血液样本对蛋白质表达进行标准化和定量,缺失值超20%参与者的蛋白质被排除;使用R包mice插补蛋白质缺失值,并用Lasso回归模型筛选T2D的核心蛋白。
关联分析:使用dplyr包和purrr包集成各种数据集后,应用Cox比例风险模型初步确定T2D患者中与CHD发生相关的蛋白质,再通过MR分析对这些蛋白质与CHD的因果关联进行验证。
预测模型构建与评估:将经过验证的蛋白质整合到预测模型中,并用ROC曲线、AUC值、C指数和DCA等方法评估模型对未来CHD发生的预测能力。
药物预测:使用DGIdb数据库预测可能影响T2D患者CHD发生的药物。
目的:在T2D患者中识别与CHD发生相关的蛋白质,并验证其与CHD发生的因果关联。
结果:
1. 从UKB数据库获取的血浆蛋白数据经数据筛选、缺失值填补、Lasso回归模型筛选以及蛋白质相互作用网络构建等方法后,成功识别出488种与T2D相关的核心蛋白质;
2. 应用Cox比例风险模型分析488种核心蛋白质与T2D患者中CHD发生之间的关联,发现125种蛋白质与CHD发生相关,其中102种蛋白质(如PCSK9)呈正相关,23种蛋白质(如NRP1)呈负相关(图1A);
3. pQTL MR分析显示,11种蛋白质与CHD具有因果关联,其中NEFL和NRP2经敏感性分析后被剔除(图1B);
4. Cox比例风险模型和 pQTL MR分析阳性结果之间的对应关系可见图1C-E。
目的:构建一个能预测T2D患者未来发生CHD风险的模型并进行性能评估。
结果:
1. 基于人口统计学和生活方式数据以及之前识别的与T2D和CHD相关的蛋白质,构建了四个不同的预测模型:
Model 1(基础模型):仅使用人口统计学和生活方式数据进行预测,ROC曲线下面积(AUC)为0.729,一致性指数(C-index)为0.727;
Model 2(九种蛋白质):在基础模型上添加九种与CHD相关的蛋白质进行预测,AUC为0.733,C-index为0.733;
Model 3(基础模型+PCSK9):在基础模型中仅添加PCSK9蛋白质,AUC为0.734,C-index为0.733;
Model 4(基础模型+九种蛋白质):整合基础模型和九种蛋白质进行预测,AUC达到0.819,C-index为0.818。
2. 相比前三个模型,Model 4的预测精度有明显的提高(图2A,B);
3. 校准曲线显示,Model 4更接近真实的预测概率(图2C);
4. 决策曲线分析(DCA)表明Model 4在不同阈值概率下提供了显著更好的净获益,有更高的临床应用价值(图2D)。
目的:通过中介分析揭示T2D中特定蛋白质(如PCSK9、NRP1和CD27)对CHD发生的影响。
结果:
1. 从FinnGen consortium获取了T2D的GWAS数据,包括71728例T2D患者和369007名对照个体;
2. 介导分析显示,之前的蛋白可调节T2D对CHD的影响(表1);
3. 具体而言,九种蛋白质中的PCSK9显示出显著的中介效应,其在T2D人群中的表达水平增加,导致CHD发病率更高,中介比例为5.330%。同时,NRP1和CD27也显示出统计学上显著的因果关联,中介比例分别为1.546%和1.010%。
目的:通过构建蛋白质模块网络和进行蛋白质功能富集分析,揭示与T2D和CHD相关的蛋白质之间的相互作用及其生物学功能。
结果:
1. 利用STRING数据库对上述9种蛋白质进行PPI分析,发现有10个主要相关蛋白质和20个次要相关蛋白质与这9种蛋白质密切相关,它们形成了一个包含168个相互作用的网络(图3A);
2. 功能富集分析显示,这9种蛋白质参与了302个生物学过程、8个细胞组分和36个分子功能,涉及冠状血管形态发生、脂质稳态和系统激素调节等过程(图3B);
3. 此外,这9种蛋白质主要富集在胆固醇代谢和肾素-血管紧张素系统等通路中,表明它们在脂质代谢和心血管调节中发挥重要作用。
目的:解析空间转录组中DLBCL患者的细胞景观。
结果:
1. 使用DGIdb数据库,成功预测并识别了针对九种关键蛋白质的32种潜在药物,其中23种药物已知与CHD、心肌炎和高血压等疾病相关;
2. 此外,还发现了九种新药物,其中cytidine-3′-monophosphate预测得分最高,表明其具有治疗T2D和CHD、以及在管理T2D的同时预防CHD的潜力(图3C)。
本文通过蛋白质组分析、机器学习算法、Cox比例风险模型、孟德尔随机化分析及功能富集分析等方法,从53014名参与者的数据中识别出488种与T2D相关的核心蛋白质,其中125种与冠心病(CHD)发生相关,进一步验证出9种蛋白质(如PCSK9、NRP1和CD27)与CHD存在因果关联。随后,研究结合人口统计学和生活方式数据以及这些蛋白质构建了预测模型,其AUC值达0.819,能有效预测T2D患者未来CHD的发生。同时,研究通过中介和功能分析揭示了这些蛋白质在T2D与CHD关联中的作用机制及参与的生物学过程,并预测出32种潜在治疗药物,为T2D患者中CHD的早期预测和干预提供了新的生物标志物和治疗靶点。
公众号后台私信太多回复不及时,SCI论文润色服务可以添加下图客服微信👇,其他合作或平台交流可加入我们平台交流群(Q群二维码在下面👇),找管理员对接,与你的同行们共同交流、学习、进步。
SCI论文润色|翻译|降重|投稿咨询|SCI期刊推荐等业务详情请扫码咨询!
不想错过生信文献解读
欢迎大家添加生信学霸为星标推荐
QQ群:744969477
SangerBox平台交流群