社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

易学的深度学习6+分套路来一打?

科研菌 • 4 年前 • 295 次点击  

↑↑↑   关注研乎   ↑↑↑

大家好,今天布丁和大家分享的是一篇6+分的学习笔记;文末阅读原文可获得学习笔记。

题目:应用深度学习法在鼻咽活检中成功识别鼻咽癌

一、背景

鼻咽癌(NPC)是一种具有独特种族倾向、与EB病毒相关的癌症。其发病率在某些种族中较高,在流行区内,大多数NPC病例为非角化型,以未分化或低分化的癌细胞和大量混合炎性细胞为特征,主要为小淋巴细胞和浆细胞。这些形态学特征可能给病理诊断带来困难,特别是对于经验较少的病理学家或非流行区。而最近,利用人工智能(AI)分析病理图像越来越具有可行性,在NPC等形态上的病理图像识别中采取AI辅助可以提高病理学家的诊断效率和准确性。

二、研究思路

三、结果解析

1. 贴片级模型

        从被事先人为标记过的鼻咽活检标本中裁剪并采集贴片样本,利用ResNeXt(具有残差和起始架构的深度神经网络),并经历了初始化、更新现有模型的内核权重即SGD(随机梯度下降),建立了原始的贴片级模型。在此过程中,发现具有如生发中心、良性上皮细胞等某些形态学特征的良性鼻咽部贴片易被错判为NPC。为了规避这种错误,对该模型的训练数据进行关于良性上皮细胞区域与生发中心区域贴片水平方面的拓展,重新训练的贴片级模型成功地将生发中心和良性上皮细胞识别为良性组织。

        制作了关于这个模型算法的学习曲线以及原始与最终的受试者工作特征(ROC)曲线,其中可见,ROC曲线下面积(AUC)从原始模型到最终模型有显著增加,说明该模型的效能得到较显著的改进。

图1 训练数据的扩展有效防止贴片的错误分类

图2 算法的学习曲线和ROC曲线(1)
2. 用于贴片水平识别的关键形态学特征

        利用梯度加权类激活映射(Grad-CAM)对被贴片级模型辨别为鼻咽癌的贴片进行处理,以此来可视化贴片中模型预测的重要区域定位与比较。结果显示,将贴片归类为NPC的最重要区域(红色)与可明确识别的癌细胞的位置相关(箭头),证实贴片级模型确实可辨别NPC肿瘤的形态学特征。

图3 通过贴片级模型归类为NPC的贴片(256 × 256像素)的Grad-CAM结果
3.玻片级模型

        通过对测试组中的鼻咽癌病理标本进行贴片级模型处理,并分别与EB病毒(EBV)编码的小RNA(EBER)原位杂交、H&E形态推导处理对比后,发现贴片级模型可成功确定癌细胞的区域,与EBV编码的小RNA(EBER)原位杂交确定的区域相似。尽管存在许多混合淋巴细胞,模型仍能有效地鉴定肿瘤细胞。

        结合以上推断的概率图、低分辨率全玻片图像、残差网络ResNet后,建立了玻片级模型,并制作了该模型算法的学习曲线和受试者工作特征(ROC)曲线,结果显示,载玻片级模型的性能与病理学住院医师(红色十字)相当,但略低于主治病理学家(蓝色十字)和住院医师(绿色十字)。

图2 算法的学习曲线和ROC曲线(2)

图4 贴片级模型和EB病毒编码的小RNA原位杂交之间的相关性

图5 贴片级模型与H&E形态之间的相关性

小结

       这篇学习笔记从被事先人为标记过的包含鼻咽癌与鼻炎良性组织的鼻咽活检标本中裁剪并采集贴片样本,利用ResNeXt、SGD以及后续的拓展完善数据建立了贴片级模型,并通过Grad-CAM证实贴片级模型确实可辨别NPC肿瘤的形态学特征,后又根据贴片级模型推断的概率图、低分辨率全玻片图像、残差网络ResNet,又建立了玻片级模型。在建立模型的过程中,简明地描述了相关算法的学习曲线,并利用ROC曲线检验了模型的性能。综上,这篇学习笔记首次开发了深度学习算法来识别鼻咽活检中的NPC,对该病的临床病理诊断有较大意义,但由于图像是手动注释,因此不能排除由于个人主观性导致的偏倚。此外,各实验室H&E染色的颜色和强度往往不同。由于此算法是使用单个实验室的载玻片开发的,对于其他机构的病例,准确性可能会降低。因此,使用其他实验室的病例扩展培训数据应该有助于在未来实现更稳健的发展。点击下方的阅读原文,即可获取学习笔记原文。

编辑:布丁

校审:虾饺皇 糯米饭

学术讨论群
备注单位+方向
群内每天分享文献和解读心得!



请大家点击右下角

科研菌分享给更多有需要的人


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/103940
 
295 次点击