社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

QB|不同的机器学习技术,从医学影像中检测和诊断COVID-19的效果如何?

科研圈 • 3 年前 • 372 次点击  

本文来自“QB期刊”,文章仅代表作者观点,与“科研圈”无关。


由于反转录聚合酶链式反应(RT- PCR)检测技术的可用性有限且成本较高,许多研究提出了将机器学习技术用于从医学影像中检测COVID-19。近日, 来自澳大利亚Charles Sturt University的Muhammad Ashad Kabir研究组系统地回顾、评估并综述了使用不同机器学习技术从胸部X光和CT扫描图像中检测和诊断COVID-19的研究文章。相关论文“A survey of machine learning techniques for detecting and diagnosing COVID-19 from imaging点击标题或文末“阅读原文”下载PDF全文发表在Quantitative Biology期刊上。



全文概要

新冠在全球范围内的传播已致14多亿人感染COVID-19并导致300多万人死亡。逆转录聚合酶链式反应(RT-PCR)检测技术是被广泛接受的标准诊断方法,但该方法存在一些缺点,如它需要从鼻咽拭子中提取病毒RNA为模板进行检测;RT-PCR检测技术比较耗时等。因此,世界各地的研究人员正在寻求一种快速、安全和自动化的方法来诊断COVID-19。由于X射线和CT扫描这两种医学成像技术在COVID-19等肺部炎症相关疾病上显示了优越性,所以研究人员考虑以这两种成像技术为基础,建立一个快速、准确并且自动化的COVID-19检测系统。武汉的一项研究表明,CT扫描对COVID-19的诊断具有比RT-PCR检测具有更高的敏感性。


自去年以来,有许多研究在COVID-19的诊断、治疗和随访中探索了基于机器学习(ML)的方法,其中深度学习(DL)相关的方法备受青睐。但从医学成像中诊断COVID-19仍然具有挑战性。更高的检测精度和确诊能力是COVID-19检测的首要任务。本文旨在揭示研究人员提出的基于DL的架构,以建立一个使用CT扫描和X射线的COVID-19自动诊断系统。作者总共将98篇相关领域的文章纳入了调查,与过去的类似领域的调查进行比较,并主要关注数据源和预处理策略,特征提取,分类,视觉解释技术,以及对比基于ML的模型和放射科医生的检测性能。


作者首先介绍了98篇文章中常用的数据来源,其中包括COVID-19 CT segmentation、COVID-CT等8个CT扫描数据集和Covid-chestxray-dataset、COVID-19 radiography database等13个胸部X光片图像数据集。作者列出了这些数据集的来源文献、下载网址和图像数量。这些数据集大部分是公开的,但也有一些不能通过公开途径获取。


接下来,作者介绍了针对CT和X光片图像数据的预处理方法,以及其调查的98篇工作分别使用了哪些方法及所占比例。涉及的方法包括调整大小、翻转、旋转等对图像的直接操作,也有少量工作使用了生成对抗网络来做图像预处理(图1)。


图1. 不同类型的预处理技术
(A) 224×224 重调整. (B) 亮度调节. (C) 生成对抗网络图解表示. (D) 垂直翻转

 

图像的特征提取通常是此类工作的核心步骤,作者同样是对CT数据和X光片数据的特征提取进行了分类讨论。在泛图像处理领域常用的特征提取神经网络模型也被广泛用于COVID-19检测工作中,其中包括ResNet、VGG、DenseNet、CapsNet等十多种网络,作者列出了使用每一种网络的文章。此外,针对CT和X光片数据的特殊性质,也有很多新的网络结构被提出,包括PDCOVIDNet、CovMUNET等9个针对X光的结构和DECAPS一个针对CT的结构。作者对每种网络的基本原理和得到的结果进行了简单介绍(表1)。


表1. COVID-19检测中常用的CNN架构


模型的最后一步是对提取的特征做分类,要实现分类,既可以直接在深度学习框架中用Logistic层或softmax层作为神经网络的最后一层,也可以将网络提取出的特征用SVM、KNN等传统分类方法进行分类。作者指出,在其调查的工作中,使用二分类的工作数量远远多于使用多分类的工作,然而,二元分类在检测COVID-19时可能会有歧义,因为它不能区分其他病毒性肺炎和COVID-19。


为了评估模型的检测性能,这些方法大多通过划分训练、验证、测试集的方法,计算模型在测试集上的正确率、准确率、灵敏度、特异性或F1分数等指标。作者整理了每篇文章划分数据集的方法、使用的评估指标和最后得到的分数,并根据模型对CT图像(表2)和X-光片(表3)的检测结果分别进行比较。


表2.CT图像处理中所用的模型及性能检测


表3. X-光片处理中所用的模型及性能检测


值得注意的是,不同模型的输出结果也不一样,一些模型只能判断图像中有没有COVID-19感染,但也有部分工作可以定位到图像异常区域,或是给出异常的解释,作者对98篇文章的这一区别也进行了分类、讨论和统计。在调查的文章中,有一些文章将自己的模型结果与放射科医生的诊断结果进行了比较。该调查也对这些比较结果进行了介绍,结论是基于ML的方法提供了比独立放射科医生更好的检测性能。

 

对结果的解释性较弱是深度学习方法的缺点,这也使得CNN架构不太适合用于医疗诊断系统。在调查的文章中,有一些工作尝试了对结果的解释,大多是通过可视化的方法,突出神经网络决策过程中重要图像区域。以前使用的一些可视化方法有:类激活图(CAM)、基于梯度的类激活图(Grad-CAM,Grad-CAM++)、分层相关性传播(LRP)和局部可解释模型-诊断解释(LIME)等。对于CT扫描和X光片,Grad-CAM是使用最多的可视化技术。

 

最后,作者讨论了本文调查的工作,指出其中的部分工作虽然准确率高,但仍有数据集小、类不平衡等问题,可能导致模型的过拟合。此外,这些研究没有包括临床症状信息(如发烧、咳嗽、疲劳)和人口统计信息(如年龄、性别、地点)。由于COVID-19有可能发生突变,冠状病毒的行为相对未知,所以使用这两类信息可以提升基于ML模型的性能。第三个限制是,以前的研究大多没有注意到对基础事实的验证。因此,需要记录RT-PCR跟踪和图像信息之间的时间,以建立一个基准,并促进有效的测试,这有助于使模型更加强大。另一个局限性与可视化技术(即CAM,Grad-CAM)有关,其中激活区域高度分散,并强调了不相关的区域,特别是X射线图像中的纵膈和肩部区域。


为了加快机器学习技术在大量医疗图像上的应用,世界各地都颁布了COVID-19的CT扫描和X射线图像的各种基准。但其中仍有许多挑战,包括图像的统一预处理、机器学习专家与放射科医生的合作模式、统一的基准和外部验证。模型的可解释功能也是一大挑战,以实现模型决策的公平性和问责制。


QB 期刊介绍

Quantitative BiologyQB期刊是由清华大学、北京大学、高教出版社联合创办的全英文学术期刊。QB主要刊登生物信息学、计算生物学、系统生物学、理论生物学和合成生物学的最新研究成果和前沿进展,并为生命科学与计算机、数学、物理等交叉研究领域打造一个学术水平高、可读性强、具有全球影响力的交叉学科期刊品牌。 

QB 期刊目前已被 ESCI, Scopus, CSCD 等国内外重要数据库收录。Citescore 2021 = 4.6,预计明年将获得第一个影响因子(IF)。



《前沿》系列英文学术期刊

由教育部主管、高等教育出版社主办的《前沿》(Frontiers)系列英文学术期刊,于2006年正式创刊,以网络版和印刷版向全球发行。系列期刊包括基础科学、生命科学、工程技术和人文社会科学四个主题,是我国覆盖学科最广泛的英文学术期刊群,其中13种被SCI收录,其他也被A&HCI、Ei、MEDLINE或相应学科国际权威检索系统收录,具有一定的国际学术影响力。系列期刊采用在线优先出版方式,保证文章以最快速度发表。


中国学术前沿期刊网

http://journal.hep.com.cn



备注:本文来自“QB期刊”,凡本公众号转载、引用的文章、图片、音频、视频文件等资料的版权归版权所有人所有,如因此产生相关后果,将由版权所有人、原始发布者和内容提供者承担,如有侵权请尽快联系删除。
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/146425