Py学习  »  机器学习算法

南京大学刘震团队: 机器学习助力代谢指纹图谱分析, 实现肝癌精准诊断

RSC英国皇家化学会 • 1 年前 • 353 次点击  

研究背景

原发性肝癌是我国常见的恶性肿瘤之一,临床上对其进行早期诊断的方法多基于甲胎蛋白这一疾病标志物,可是较低的诊断特异性和对价格高昂的抗体的需求始终制约着这类方法的发展。

顺式二羟基类代谢物是包括核苷在内的一类重要小分子物质,其参与调控生命体中许多基础且重要的生理学过程。原发性肝癌的发生与转移均伴随着剧烈的顺式二羟基类代谢物重编程过程。

对血清中顺式二羟基类代谢物进行深度指纹图谱鉴定并探索其作为原发性肝癌早期诊断标志物的潜力具有重大临床应用价值。然而,由于体内顺式二羟基类代谢物的低丰度和高结构异质性、生物样本严重的基质干扰以及现有方法对靶向代谢组学信息挖掘的有限覆盖度等因素,对血清中顺式二羟基类代谢物进行深入分析仍然具有挑战性

质谱技术已然成为代谢指纹图谱研究的主力。可是传统的基于液相色谱或是毛细管电泳的质谱技术伴随着许多缺点。比如液相色谱需要较长的分析时间(梯度洗脱,柱平衡),较高的样品用量且液相色谱柱很容易被生物样品的高盐基质损坏,加大了实验耗材的更换频率。

而毛细管电泳技术虽然可以对带电荷物质进行有效分离,但也正是这种电荷依赖的分离机制限制了其更广泛的应用。因此,迫切需要发展灵敏高效的新型质谱技术,满足靶向代谢组学应用的临床需求。






鉴于此,南京大学刘震教授团队构建了硼酸亲和固相微萃取-溶剂挥发辅助富集-纳升喷雾电离质谱平台,可以高覆盖度的对微量血清样本进行顺式二羟基类代谢物指纹图谱测定。

同时,借助机器学习算法对获得的顺式二羟基类代谢物进行统计筛选,可以有效提取用于原发性肝癌精准诊断的特征信息并开发相应的诊断模型(图一)。

图一. 硼酸亲和萃取-溶剂挥发辅助富集-纳升喷雾电离质谱法以及机器学习辅助的诊断方法开发示意图


该成果以 “Machine learning-empowered cis-diol metabolic fingerprinting enables precise diagnosis of primary liver cancer” (《机器学习助力的顺式二羟基类代谢物指纹图谱分析实现原发性肝癌精准诊断》) 为题,发表在英国皇家化学会期刊 Chemical Science 上。

研究内容

研究人员首先制备了可以靶向萃取顺式二羟基类代谢物的硼酸亲和固体微萃取探针,通过电镜表征和亲和萃取实验确认了硼酸配体的成功修饰(图二)。

图二. 硼酸亲和萃取探针的表征。(A) 和 (B) 硼酸亲和萃取探针的扫描电子显微镜表征;(C) 直接分析含有同等浓度的标准品(腺苷、鸟苷、3-甲基尿苷、2′-脱氧腺苷、2′脱氧尿苷和胸苷)混合物的质谱检测结果;(D) 使用硼酸亲和萃取探针从上述溶液中提取的化合物的质谱检测结果。


紧接着,作者优化了该方法的多项参数,包括解吸溶剂配比和对应纳升喷雾电压,萃取时间,解吸次数等,使得该方法可以有效应用于复杂生物样品的顺式二羟基类代谢物指纹图谱鉴定。与血清的直接质谱测定或是不使用溶剂挥发辅助富集的测定方法相比,可以发现本工作构建的方法具有显著提高的顺式二羟基代谢物鉴定能力(图三)。

图三. 硼酸亲和固相微萃取-溶剂挥发辅助富集-纳升喷雾电离质谱平台的构建和性能评估。(A) 纳升喷雾电压和解吸溶剂配比的优化;(B) 萃取时间的优化;(C) 解吸次数的优化;(D) 血清直接鉴定的质谱结果;(E) 不采用溶剂挥发辅助富集的代谢物鉴定结果;(F) 采用溶剂挥发辅助富集的代谢物鉴定结果。


结合串联质谱鉴定以及内标物质的引入,作者评估了该质谱平台进行顺式二羟基类代谢物指纹图谱鉴定时的定性与定量能力,为方法的进一步实际体系应用打下坚实基础(图四)。

图四. 血清中目标物的定性和定量分析。腺苷(A)、3-甲基尿苷(B)、鸟苷(C) 和异丙肾上腺素(D) 的二级质谱测定结果;(E) D-半乳糖标准品、其同位素 D-半乳糖 1-13C 标准品及其等浓度混合溶液的质谱测定结果;(F) 对D-半乳糖的信号-浓度校准曲线;(G) 原发性肝癌者和健康人 D-半乳糖的比较。


最后,作者对不同来源(原发性肝癌患者,甲、乙、丙型肝炎患者和健康人)的血清样本进行了顺式二羟基代谢物指纹图谱测定。根据不同顺式二羟基类代谢物的 p 值和差异倍数关系,结合偏最小二乘回归分析等算法,构建了诊断特异性和灵敏性均优于传统甲胎蛋白标志物的新诊断模型(图五)。可以预见的是,机器学习助力的集成质谱平台将为面向精准医学的重要靶标发现与新颖诊断方法开发提供坚实支撑。

图五. 血清样本顺式二羟基代谢物指纹图谱鉴定和原发性肿瘤早期诊断模型开发。(A) 原发性肝癌患者和对照样本的血清顺式二羟基代谢物指纹图谱对比;(B) 对训练集的偏最小二乘回归分析;(C) 对训练集的火山图分析;(D) 原发性肝癌患者和对照样本间上调最显著物质的箱式图比较;(E) 原发性肝癌患者和对照样本间下调最显著物质的箱式图比较;(F) 诊断模型的接受者操作特征曲线;(G) 和 (H) 采用的诊断模型的混淆矩阵。



论文信息

Machine learning-empowered cis-diol metabolic fingerprinting enables precise diagnosis of primary liver cancer
Pengfei Li(李鹏飞,南京大学),Shuxin Xu(许舒欣,南京大学),Yanjie Han(韩延杰,南京大学),Hui He(贺晖,南京大学)and Zhen Liu *(刘震,南京大学)
Chem. Sci., 2023, 14, 2553-2561
https://doi.org/
10.1039/D2SC05541D

通讯作者

刘震 教授

南京大学

南京大学特聘教授,博士生导师,国家杰出青年基金获得者,英国皇家化学会会士。1998年于中国科学院大连化学物理研究所获博士学位。2000-2002 年,日本兵库大学日本学术振兴会(JSPS)特别研究员;2002-2005年,加拿大滑铁卢大学博士后。2005 年获聘南京大学教授,2006 年起任博士生导师,2008年入选教育部“新世纪优秀人才”, 2011 年-2014 年任加拿大滑铁卢大学工程学院兼职教授,2014年获国家杰出青年科学基金,2016 年入选江苏省“333 高层次人才”(第二层次)。英国皇家化学会会士、中国化学会高级会员、美国化学会会员,兼任国际分子印迹学会理事会理事、中国质谱学会常务理事、中国化学会色谱专业委员会委员、中国化学会质谱专业委员会委员、中国生物化学与分子生物学会蛋白质组学专业委员会委员、《Analytica Methods》副主编、《Electrophoresis》、《Separation Science Plus》、《Journal of Chromatography Open》、《科学通报》、《分析化学》、《质谱学报》和《色谱》等杂志编委。主要从事分子识别、亲和分离、疾病诊断、单细胞分析和癌症纳米治疗等研究,主持国家重大科研仪器项目和基金委重点项目等国家级科研项目 10 余项,已在 Chemical Society Review,Accounts of Chemical Research,Angewandte Chemie International Edition,Nature Protocols,Adcanced Science, ACS NanoChemical Science 等期刊上发表论文 170 余篇,目前 h 因子 53,主编及合著著作 2 部,出版专章 7 章,获授权专利 15 项。2011年和 2017 年先后获中国分析测试协会科学技术奖一等奖共 2 次,2016 年获Phenomenex & Analytical Scientist 联合颁发的科学人文奖银奖。2020 年荣获美国化学会测量科学进展讲座奖。

相关期刊

Home to exceptional research and thought-provoking ideas. Open and free, for authors and readers.

rsc.li/chemical-science

Chem. Sci.

2-年影响因子*9.969
5-年影响因子*9.974
最高 JCR 分区*Q1 化学-综合
CiteScore 分14.7
中位一审周期31 


Chemical Science 是涵盖化学科学各领域的跨学科综合性期刊,也是英国皇家化学会的旗舰期刊。所发表的论文不仅要在相应的领域内具有重大意义,而且还应能引起化学科学其它领域的读者的广泛兴趣。所发表的论文应包含重大进展、概念上的创新与进步或者是对领域发展的真知灼见。发文范围包括但不限于有机化学、无机化学、物理化学、材料科学、纳米科学、催化、化学生物学、分析化学、超分子化学、理论化学、计算化学、绿色化学、能源与环境化学等。作为一本钻石开放获取的期刊,读者可以免费获取所发表论文的全文,同时从该刊的论文版面费由英国皇家化学会承担,论文作者无需付费。

Editor-in-Chief

  • Andrew Cooper
    🇬🇧 利物浦大学

Associate editors

  • Vincent Artero
    🇫🇷 格勒诺布尔阿尔卑斯大学/法国原子能和替代能源委员会

  • Luis M. Campos
    🇺🇸 哥伦比亚大学

  • Michelle Chang
    🇺🇸 加州大学伯克利分校

  • Lin Chen
    🇺🇸 西北大学

  • Graeme Day
    🇬🇧 南安普敦大学

  • Serena DeBeer
    🇩🇪 马普化学能转化研究所

  • Mircea Dincă
    🇺🇸 麻省理工学院

  • Vy Dong
    🇺🇸 加州大学尔湾分校

  • François Gabbaï
    🇺🇸 德克萨斯 A&M 大学

  • Subi George
    🇮🇳 贾瓦哈拉尔·尼赫鲁高级科学研究中心

  • Stephen Goldup
    🇬🇧 南安普敦大学

  • Jinlong Gong (巩金龙)
    🇨🇳 天津大学

  • Zaiping Guo (郭再萍)
    🇦🇺 阿德莱德大学

  • Christopher A Hunter
    🇬🇧 剑桥大学

  • Malika Jeffries-EL
    🇺🇸 波士顿大学

  • Ning Jiao (焦宁)
    🇨🇳 北京大学

  • Tanja Junkers
    🇦🇺 莫纳什大学

  • Hemamala Karunadasa
    🇺🇸 斯坦福大学

  • Maja Köhn
    🇩🇪 弗莱堡大学

  • Yi-Tao Long (龙亿涛)
    🇨🇳 南京大学

  • James K McCusker
    🇺🇸 密歇根州立大学

  • Thomas J Meade
    🇺🇸 西北大学

  • Paolo Melchiorre
    🇮🇹 博洛尼亚大学

  • Gabriel Merino
    🇲🇽 墨西哥国家理工学院科研和高级研究中心

  • Carsten Schultz
    🇺🇸 俄勒冈健康与科学大学

  • Dmitri Talapin
    🇺🇸 芝加哥大学

  • Toshiharu Teranishi
    🇯🇵 京都大学

  • Andrei Yudin
    🇨🇦 多伦多大学

* 2021 Journal Citation Reports (Clarivate, 2022)

 CiteScore 2021 by Elsevier

 中位数,仅统计进入同行评审阶段的稿件







欢迎联系我们发布论文报道
📧 RSCChina@rsc.org

点击下方「阅读原文」查看论文全文
↓↓↓

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/153102
 
353 次点击