Py学习  »  机器学习算法

结合拉曼光谱和深度学习算法在属和种水平上鉴定细菌病原体

深度学习辣汤小组 • 1 年前 • 291 次点击  

深度学习辣汤小组文献阅读学习之七十三

结合拉曼光谱和深度学习算法在属和种水平上鉴定细菌病原体

DeepLearning 深度学习辣汤小组

 2023/1/3 


2022年,来自广东省人民医院的Liang Wang等人证实了整合表面增强拉曼光谱技术和机器学习算法能够快速准确识别不同细菌病原体,并在Microbiology Spectrum(IF:9.04,生物2区)期刊上发表题为“Identification of Bacterial Pathogens at Genus and Species Levels through Combination of Raman Spectrometry and Deep-Learning Algorithms”的文章。

DOI:

https://doi.org/10.1186/s13054-020-2752-7


一、研究背景

传染病是由微生物引起的一组疾病,可在人与人之间传播或从动物传染给人。细菌病原体是人类患上传染病的主要诱因之一,如果在细菌感染过程中快速准确地识别致病因子,这将极大地预防病原体传播、改善患者治疗和护理。近年来,由于成本低廉、无创性和无标签的特点,拉曼光谱(RS,Raman spectroscopy)正成为一种快速检测细菌的技术。但该方法仍存在再现性差、信噪比低等技术问题。表面增强拉曼光谱(SERS,Surface enhanced Raman spectroscopy)是解决传统RS信噪比低问题的有效方法。考虑到SERS数据的复杂性,数据处理过程中经常使用如CNN、SVM等机器学习算法构建光谱模型。目前SERS在细菌鉴定中的应用处于起步阶段,未来SERS结合机器学习鉴别多种细菌病原体具有极大的潜力

二、数据集

从临床样品中分离出的9个不同细菌属的30个细菌种。从拉曼光谱仪中总共获得了17149个SERS光谱。SERS光谱数据经过多项式拟合、基线校正和归一化等常规的方法预处理之后,通过计算每个拉曼位移的强度来生成每个细菌物种的平均SERS光谱,同时也相应地生成标准偏差(图1A)。然后,使用点矩阵显示每个光谱的特征峰分布(图1B)。

三、方法

在这项研究中,使用1种深度学习算法(CNN)和3种经典机器学习算法(RF、SVM和Adaboost)对不同细菌的SERS光谱数据进行分类和预测。CNN网络结构主要包括一个输入层、6个卷积层、3个最大池层和一个完全连接层。使用了AUC、ACC、Pre、Recall、F1等评价指标来衡量所有模型的性能。还使用混淆矩阵描述样本数据的真实属性与预测结果之间的关系。

四、结果与结论

可以从表1中清楚地看到,CNN的性能与RF识别不同细菌属时性能相似,并且这两种算法的性能都比其他两种算法更好。此外在表2中,识别不同细菌种时CNN的性能始终优于所有其他经典机器学习算法。图2表明,CNN模型在鉴别细菌属(AUC:1.0000)和细菌种(AUC:0.9958)上都取得了最佳性能。从图3A中的结果可以看出,对于30种不同的细菌,CNN模型实现了良好的预测能力,每个菌种的分类ACC大于或等于90%。对于细菌属的混淆矩阵,CNN模型可以在每个菌属中实现ACC大于98%,其中1%的不动杆菌和2%的链球菌被错误地预测为肠球菌属(图3B)。综上结果表明,CNN识别致病菌的预测精度最高。

总之,SERS技术整合机器学习算法在细菌病原体实验室环境下快速识别方面已经展示出广阔的潜力,该技术有可能进一步发展和完善,未来或许能够直接识别和预测临床样本中的细菌病原体

图1:30种细菌的平均拉曼光谱和相应的特征峰(A) 30种不同临床细菌病原体的平均SERS光谱

图2:通过AUC值比较(A)属级和(B)种级四种算法ROC曲线

图3:(A)种级(30种)和(B)属级(9属)细菌病原体的CNN模型混淆矩阵

表1:四种机器学习算法在细菌属水平上预测能力的比较

表2:四种机器学习算法在细菌种水平上预测能力的比较


Pepper soup transformed by: Geng Shi




  //  

深度学习辣汤AI小组由徐州医科大学以及徐州医科大学附属医院一群热爱人工智能的小伙伴们组成,欢迎大家跟我们交流学习!


扫码关注我们

欢迎加入我们!

成员微信号:cy2011mcu

添加好友时请备注:

您的 单位-科室-姓名-研究方向


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/173346