社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

Nature子刊(IF 14.7):糖基化+机器学习,张振声/陆豪杰/张莹团队构建膀胱癌N-糖组诊断模型

生信学霸 • 1 月前 • 70 次点击  

膀胱癌(BC)作为泌尿系统中最常见的恶性肿瘤,面临巨大的诊断挑战。近来液体活检因无创性和广泛适用性越发受到关注,尿液因其成分相对简单且易于获取的优点被认为是膀胱癌诊断标志物开发的最佳选择。同时,细胞外囊泡(EVs)是几乎所有细胞类型释放的双膜囊泡,广泛存在于各种体液中,其不仅反映了其原始细胞的生理和病理状态,还影响癌症的侵袭、转移和进展,但尿液EVs中的糖基化变化对疾病标志物的探索仍然被忽视。Nature Communications 上发表的新文章通过尿液EVs N-糖组技术分析了膀胱癌相关的糖基化特征,生成了人尿液EV的N-糖组图谱,并构建可有效区分BC患者和健康个体的Eight N-糖诊断模型。

标题:Urinary extracellular vesicle N-glycomics identifies diagnostic glycosignatures for bladder cancer

期刊:Nature Communications(IF 14.7)

出版商:Springer Nature

发表:2025年3月7日

DOI:https://doi.org/10.1038/s41467-025-57633-9

关键词:膀胱癌 | 糖生物学 | 糖基化 | 质谱法 | 生物标志物

技术手段:N-糖组、糖蛋白质组、N-糖空间成像、NTA、机器学习等

核心思路:


 材料与方法 

Materials and Methods

数据来源:从上海长海医院获取人类尿液和BC组织样本。

数据预处理:使用flexAnalysis处理MALDI-TOF质谱数据后,利用GlyHunter和之前开发的逆合成游离寡糖库对数据进行注释,再用R进行统计分析。

模型构建与评估:使用mlr3verse包在发现队列数据上训练了10种算法,并在发现队列上对模型的准确性、f1 分数、ROC AUC、敏感性和特异性进行了评估;使用 DALEX和DALEXtra包评估候选生物标志物的特征重要性。


 分析结果 

Results

EVs特征及质控

在发现队列中,研究共纳入了132例个体,包括45个BC样本、31个UB样本、25个UM样本和31个HC样本,用于筛选N-糖候选标志物(图1a)。首先,研究通过NTA、WB和TEM来表征分离的EVs。从四组临床样本中分离出的EVs粒径分布为40-200nm(图1b)。WB结果显示,EV标志物(CD9、CD81和TSG101)富集而非EV标志物不存在(图1c)。在TEM下,EVs呈现典型的盘状或茶托状结构(图1d-g)。这些结果表明分离的EVs质量高,可进行下游分析。此外,QC样本间的强相关和较低技术变异,证明实验流程稳定可靠(图1h,i)。

图1


尿液EVs中N-Glycome谱的全面概况

在四组临床样本中共鉴定出252种N-糖,其中BC组平均鉴定出114种N-糖,显著低于HC组的143种(图2a)。四组共同拥有194种N-糖,超90%的N-糖存在于两个或多个亚组中(图2b)。进一步分析发现,杂化或复杂类型N-糖为EVs的主导类型,并且不同组N-糖的组成存在差异(图2c,d)。具体而言,相比其他组,BC组高分支结构的N-糖比例降低,低分支结构的N-糖链比例升高,且唾液酸化水平增加,岩藻糖化水平减少。

图2


膀胱癌候选N-糖诊断生物标志物的筛选

随后,研究通过ANOVA分析进一步分析BC患者相比健康人的N-糖改变。在130种N-糖(去除了样品中缺失值率高于50%的N-糖)中,83种表现出显著的组间差异,其中71种在BC组和HC组间存在显著差异(图3a)。研究整合了BC和非BC组间的差异表达N-糖,并应用此策略和筛选标准(p<0.05,log2FC>1)确定了10种候选生物标志物,后因检测率小于95%排除了两种(图3b-d)。这8种N-糖在所有N-糖中排名前50%,强度很高,并且均为复杂或混合类型(图3e)。

图3


膀胱癌诊断模型的开发和评估

接着,研究利用机器学习算法基于这8种N-糖标志物构建了诊断模型。研究首先使用基线模型比较了发现队列上9种算法的分类性能,发现它们性能相似(图3f)。鉴于逻辑回归模型的简单性和可解释性,研究最终选择Logistic构建诊断模型。然后,研究在验证队列1和验证队列2中评估了模型的性能,两个队列的特征如图4a,b所示。在两个独立的验证队列中,该模型表现出较高的准确率、敏感性和特异性,能够有效区分膀胱癌患者与健康个体,并对膀胱癌的不同亚型具有一定的区分能力(图4c-e)。然而,该模型区分BC与其他泌尿系统疾病患者(UB 和 UM)时的表现相对较弱,AUC值分别为0.72和0.69。

图4


携带癌症相关N-糖特征的EVs糖蛋白的全面表征

为进一步了解泌尿EVs的功能和潜在作用,研究对BC、UB、UM和HC组进行了N-糖蛋白质组学分析。研究共鉴定出7787个糖型,其中549个糖基化位点和206个糖蛋白被鉴定为携带癌症相关N-糖特征(EVcans)。大多数EVcans位点仅含有一种糖,不到10%的位点含有三种以上的糖,类似情况在EVcans蛋白中也存在(图5a)。有趣的是,H5N4S2在蛋白质和位点水平上都更有可能与H6N5S3和H4N3S1同时发生(图5b)。随后,研究保留了无缺失值的糖型并发现不同组的EVcans表达存在显著差异(图5c-d)。BC组的EVcans表达显著高于其他组,且这些糖蛋白主要与免疫活动相关,参与补体激活和凝血级联反应等通路。

图5


尿液EVs和组织N-糖组的成对比较分析

为进一步比较BC患者的糖基化谱,研究收集了3名BC患者的肿瘤、配对癌旁组织(NAT)和尿液EVs,用于N-糖组分析。在肿瘤和NAT中,研究共鉴定出153种N-糖,其中114种在肿瘤样本中一致鉴定,88种在NAT样本中一致鉴定。21种N-糖在肿瘤和NAT间表现出显著差异,其中高甘露糖型糖在肿瘤样本中显著富集。MALDI-MSI分析和H&E染色结果表明,N-糖特征与不同组织类型相关(图5e,f)。此外,EVs和肿瘤的N-糖也存在显著差异,特别是在唾液酸化水平上,EVs中唾液酸化水平显著高于肿瘤组织(图5g)。这些结果表明,EVs中的N-糖可以作为膀胱癌诊断的潜在标志物。

图5


膀胱癌细胞系与其衍生的EVs间N-糖组差异分析

为了探究EVs及其源细胞的糖基化特性,研究培养了5种不同的膀胱细胞系,并使用超速离心分离EVs进行N-糖组学分析。五种细胞系及其衍生的EVs中鉴定出的N-糖平均数量存在明显差异,其中47种N-糖为所有细胞系共有,56种N-糖在所有EVs中均有鉴定(图6a,b)。联合分析显示,细胞系和EV样品间的差异显著大于细胞系之间的差异(图6c)。然后,研究聚集了具有相似结构的N-糖,发现两者即便有重叠N-糖,它们的N-糖组仍存在差异。相比细胞系,EVs中高分支结构和唾液酸化糖链的比例显著增加,而高甘露糖型糖链的比例显著减少,并且H5N4S1、H6N4F1、H5N3S1等糖表达显著升高(图6d,e)。

图6


 结论 

Conclusion

本文创新性利用尿液外泌体(EVs)进行N-Glycomes 分析,从外泌体糖基化视角开发新的诊断生物标志物。研究通过分析333例临床个体的尿液样本,全面揭示了尿液外泌体中N-糖链的组成特征,并成功建立了膀胱癌诊断模型。该模型能够有效区分膀胱癌患者(包括非肌层浸润性和肌层浸润性膀胱癌)与健康个体,ROC AUC值在两个独立验证队列中分别为0.88和0.86,表明其具有较强的诊断性能,为膀胱癌的非侵入性筛查提供了新的工具。


END

公众号后台私信太多回复不及时,SCI论文润色服务可以添加下图客服微信👇,其他合作或平台交流可加入我们平台交流群(Q群二维码在下面👇)找管理员对接,与你的同行们共同交流、学习、进步。

SCI论文润色|翻译|降重|投稿咨询|SCI期刊推荐等业务详情请扫码咨询!


不想错过生信文献解读

欢迎大家添加生信学霸为星标推荐

SangerBox小红书

打开小红书,扫码关注

每天更新生信相关资讯

SangerBox交流群 

打开QQ,扫码进群

SangerBox平台交流群

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/180447
 
70 次点击