Py学习  »  机器学习算法

【分析】暨南大学质谱团队Anal Chem:国产便携式气相色谱质谱结合机器学习用于柑橘黄龙病的现场检测

X-MOL资讯 • 9 月前 • 61 次点击  


气相色谱质谱(GC-MS)是挥发性有机物(VOCs)定性定量测定的最重要的仪器分析方法之一,已经广泛地应用在食品、生态、环境、生物、医药、能源、司法等领域。常规台式GC-MS虽能对VOCs进行准确的测定,然而由于存在样品运输、保存等中间环节,且单个样品分析需要数十分钟甚至更长时间,分析结果往往缺乏时效性,难以满足现场环境条件下的检测需求。近年来,便携式气相色谱质谱(PGC-MS)的发展和应用取得重要进展;PGC-MS具备在野外复杂环境的适应性和操控性,同时又保留了强有力的定性定量能力,能实现复杂VOCs组分的快速分离与测定,在现场分析检测的应用中发挥越来越重要的作用。然而,现有PGC-MS的数据分析主要依赖于人工处理,难以及时做出快速响应,极大限制了PGC-MS的现场应用。

论文封面图

近日,暨南大学质谱团队发展了顶空固相微萃取(HS-SPME)耦合便携式气相色谱质谱(PGC-MS)分析和机器学习在现场环境下的创新应用,通过考察147个柑橘(赣南脐橙)叶片样品,发展了柑橘叶片挥发性代谢物的现场富集和柑橘黄龙病的现场诊断方法。研究表明,HS-SPME-PGC-MS结合机器学习可以在6分钟内完成对一个样本的样品采集、色谱分离、质谱分析和数据鉴定。该方法具有分析速度快、准确率高、现场适用性好的特点。该工作还探讨了黄龙病对柑橘叶片挥发性代谢物的响应特征和代谢路径。相关成果发表在国际化学权威杂志Analytical Chemistry 上。

该工作针对现场环境的检测需求,发展了国产便携式气相色谱质谱(广州禾信)结合HS-SPME现场样品前处理和机器学习的新方法,并面向农业生产中对柑橘黄龙病诊断的迫切需求,开展黄龙病的现场诊断研究。黄龙病是由亚洲韧皮杆菌(C. Lac)侵染所引起的一种最具破坏性的柑橘类病害。黄龙病的典型症状包括叶片斑驳状黄化、果实畸形和味酸等特点。特别地,黄龙病具有数月至数年的无症状但具有传染性的潜伏期,由于黄龙病无法治愈,因此黄龙病诊断是防治病害和田间管理的关键手段。目前,精准的黄龙病诊断主要依赖于PCR技术,该技术通过精准测定柑橘叶片亚洲韧皮杆菌的DNA诊断黄龙病,然而存在分析过程复杂和耗时的特点,并且需要在实验室完成检测,难以适用于田间大规模的快速检测需求。该工作通过对柑橘叶片挥发性代谢物的现场采样和顶空固相微萃取(HS-SPME)富集,并采用便携式气相色谱质谱进行解吸与分离分析,如图1所示为分析流程和装置示意图。图2所示为果园现场测定柑橘叶片。

图1. 柑橘黄龙病现场检测示意图:(a)现场采样,(b)顶空固相微萃取,(c)便携式气相色谱质谱现场检测。

图2. 现场环境分析

为阐明HS-SPME-PGC-MS装置对柑橘叶片挥发性代谢物富集的性能,该研究考察和优化了检测性能。通过HS-SPME-PGC-MS装置获得了绿色健康叶片(图3a)、绿色无症状黄龙病叶片(图3b)和有症状黄龙病叶片(图3c)的色谱图。研究发现,绿色叶片(健康叶片和无症状叶片)和黄色叶片(有症状叶片)的色谱图显示叶片的黄化导致代谢物发生明显变化(如色谱峰11:芳樟醇);此外,无论是无症状还是有症状黄龙病感染的叶片,健康叶片获得色谱峰1~3的相对峰值都低于黄龙病感染的叶片。这些初步结果表明,感染无症状黄龙病的叶片挥发性代谢物发生明显变化,叶片黄化后,叶片代谢物进一步发生显著性变化,并且这些具有显著变化的挥发性代谢物具有可检测性。进一步地,通过监测色谱峰6(即β-pinene),优化了实验条件,发现使用DVB/CAR/PDMS探针(图3d),在80°C时(图3e),富集时间30 s(图3f)即可获得较好的富集性能。此外,研究获得了日内精密度和日间精密度分别为3.0 ~ 17.5%和8.7 ~ 18.2%,定性检测限和定量限分别为0.04 ~ 0.12 ng/mL和0.17 ~ 0.44 ng/mL,该方法在3个数量级浓度范围也显示出良好的线性关系(R2 > 0.96)。结果表明,该方法具有较好的分析性能,能适应野外环境的现场检测需求。

图3. HS-SPME-PGC-MS系统分析柑橘叶片代谢物:(a)健康柑橘色谱图,(b)无症状感染黄龙病柑橘色谱图,(c)有症状感染黄龙病柑橘色谱图,(d)固相微萃取探针优化,(e)顶空采样温度优化,(f)顶空采样时间优化。

该工作基于决策树的随机森林(RF)算法模型探寻健康、无症状和有症状的黄龙病柑橘叶片VOCs中重要标记物。图4a显示了RF模型对健康叶片、无症状黄龙病叶片和有症状黄龙病叶片排放的代谢物进行分类的多维尺度(MDS)图。不同种类叶片挥发性代谢物明显分离,这说明三类样品之间存在显著差异。根据平均降低准确率(MDA)值进一步对叶片代谢物进行排序,得到12个重要特征代谢物(图4b)。数据集(70%训练集,30%测试集;n=147)显示有症状组、无症状组和健康组的曲线下面积(AUC)值分别为0.999、0.996和0.999(图4c)。测试集结果显示,获得健康、无症状和有症状样该进行诊断的测试集准确率为93.3%。特别地,考虑到有症状叶片具有显著性外观,绿色健康/无症状组的检测准确率为96.4%,表明该方法具有很高的准确率,并具有分析速度快、现场检测等优势。

图4. 健康、无症状和有症状柑橘叶片的代谢物数据分析:(a)随机森林分类MDS图,(b)随机森林特征重要性,(c)三种柑橘叶片的AUC值,(d)三种柑橘叶片的PLS-DA图,(e)PLS-DA的VIP值。

为了获得更多的代谢物信息,采用主成分分析法(PCA)和偏最小二乘法-判别分析法(PLS-DA)对三种叶片的数据集进行了进一步的分析。与MDS图对比,三种叶片代谢物在PCA图中高度重叠,表明RF算法在处理复杂变量时通常具有更好的预测性能。PLS-DA图显示三组叶片样品具有较好的分离,显示出黄龙病的代谢特征(图4d),发现获得的标志物变量投影重要性(VIP)(图4e)与RF算法的获得的潜在标志物具有高度重叠性,揭示了这些标志物具有显著的特征性。

为了进一步探究黄龙病诱导的代谢变化,该研究展示了12种标志物在不同柑橘叶片中的热图(图5a),显示了黄龙病对健康叶片、无症状叶片、有症状叶片的代谢物差异。该工作还研究了12种标志物的代谢特征和通路(图5b)。代谢物中的萜类化合物,如芳樟醇、3-蒈烯和γ-松油烯,主要是与防御有关的VOCs。黄龙病感染叶片中γ-松油烯含量显著增加;γ-松油烯是抗菌化合物麝香草酚的前体,反映了γ-松油烯在柑橘防御黄龙病的重要性。此外,还发现3-蒈烯在有症状叶片中的浓度明显高于无症状和健康叶片。这一结果表明3-蒈烯在黄龙病感染后期保持较高的活性。研究表明,这些代谢物对黄龙病感染表现出特异性反应,并可以通过PGC-MS检测,为PGC-MS在黄龙病的诊断和研究提供了新思路。

图5. 黄龙病有关的叶片代谢物响应分析:(a)柑橘黄龙病相关重要挥发性代谢物变化热图,(b)柑橘黄龙病相关重要挥发性代谢物的代谢途径(实线表示该工作检测到的代谢物,虚线表示文献中提到的代谢物)。

小结

该工作开发了一种便携式质谱结合机器学习的分析新方法,实现了野外现场环境的应用分析,该方法具有操作简单、分析速度快、现场环境适应性好的特点,为柑橘黄龙病的诊断与代谢物的研究提供了新方法。通常,区分健康与无症状黄龙病柑橘的是柑橘田间管理的重点,不同种植条件下如海拔、气候、地域等因素影响也影响柑橘的代谢变化,这些因素需要进一步的研究。

该工作部分受国家自然科学基金和暨南大学双百英才计划“暨南杰青”项目资助。该研究第一作者是暨南大学质谱仪器与大气环境研究所硕士研究生刘希萌,通讯作者是暨南大学质谱仪器与大气环境研究所黄正旭副研究员和胡斌副研究员。

原文(扫描或长按二维码,识别后直达原文页面):
Portable Mass Spectrometry Approach combined with Machine Learning for Onsite Field Detection of Huanglongbing Disease
Ximeng Liu, Man Yi, Wenzheng Mo, Qiaoyun Huang, Zhengxu Huang*, and Bin Hu*
Anal. Chem., 2023, 95, 10769-10776, DOI: 10.1021/acs.analchem.3c01825

导师介绍
胡斌副研究员
https://www.x-mol.com/groups/hu_bin



点击“阅读原文”,查看 化学 • 材料 领域所有收录期刊

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/159148
 
61 次点击