试想一下,如果没有血压计,医学检测情况会变成什么样子呢?没有它,会增加理解中风、心脏病和肾病的风险困难程度。血压是一种被称为生物标记物的信号,它可以帮助医学研究人员了解潜在的疾病机制和对特定疾病的生物反应。
显而易见的是,生物标志物识别对早期检测和外部干预有直接的好处。当涉及到神经系统疾病时,像磁共振成像(MRI)、正电子发射断层扫描(PET)和计算机断层扫描这样的神经成像技术经常被用来识别潜在的疾病表型,表明阿尔茨海默病或脑癌的存在可能。
越来越多的研究人员通过研究和理解神经成像结果,将由先进的机器学习技术和人工智能子集组成的深度学习(DL)应用于生物标志物识别任务。
DL与传统的机器学习和统计方法相比有一个关键优势。它不依赖手工制作的数据集,而这些数据集本身就是人类限制的对象(时间、资源和研究偏见)。相反,DL可以利用原始数据中的信息,这些数据只需最少的人工干预即可处理。
因此,对于使用DL的各种下游应用程序,我们得到的结果更加准确。它们还提供了各种分析可能,其中之一是发现新的生物标志物。换句话说,DL可以帮助建立更好地预测和分类健康受试者患有疾病的患者的工具。DL还可以为未知的医学研究揭示潜在的有用见解。
除了构建能够预测疾病患者和健康受试者并对其进行分类的工具外,DL在生物标记物发现方面显示出极大的优势,并可能揭示一些对以前不可能或未知的医学研究有用的见解。这里有三个领先的例子,说明DL是如何在生物标记物发现方面进行有前景的新研究的。
神经影像生物标记物是影像衍生的测量,可以告诉我们某种疾病的严重程度或概率。例如,与阿尔茨海默病相关的生物标志物(AD)可以通过MRI测量,包括海马体积和内嗅皮质厚度。由于DL允许我们以最少的领域知识使用原始数据,多项研究已经能够确定AD以及其他脑部疾病(如帕金森病、孤独症、精神分裂症和严重抑郁症)的其他候选神经影像生物标记物。这一研究途径在识别其他鲜为人知的脑部疾病的候选神经影像生物标记物方面尤其有希望。
由于这些研究纯粹是数据驱动的,因此有可能发现许多以前医学专家未知的新生物标记物。我参与了亚利桑那州立大学和亚利桑那州梅奥诊所的相关研究,以确定创伤后头痛的神经影像生物标记物。我们看到的结果不仅与现有文献重叠,而且暗示了一些有趣的发现有待于从纯数据驱动的见解中进一步探索。研究结果将于2022年初公布。
分子生物标记物的研究与癌症研究有关,目的是了解更多关于脑癌、前列腺癌和肺癌中肿瘤突变的潜在原因。DL使研究人员能够利用组织学数据了解这些与形态学模式相关的分子“特征”或生物标记,重点是预测与突变相关的基因表达的复杂变化。DL技术是在非线性数据中寻找模式的有效方法,已显示出巨大的前景。
仅使用单一形式的数据——即仅使用神经影像学或仅使用临床数据——通常会导致非结论性结果。用小数据集很难理解复杂和异质的疾病表型。因此,研究人员现在专注于开发“多模式”深度学习方法,这种方法可以结合多个数据点来训练模型。在阿尔茨海默病的案例中,研究人员已经表明,脑脊液、PET、临床和神经心理学评估以及其他生物标记物可以与深度学习技术一起用于改进生物标记物的发现。然而,在收集如此大规模的多模态数据和能够充分利用这些数据的DL技术方面仍然存在重大挑战。
利用数据驱动技术发现生物标志物是一个快速发展的研究领域,基于问题定义和数据集可用性提出了新的方法。尽管有了这些发展,仍然存在着需要解决的挑战。医疗数据集通常仅由少数组织收集足够数量的数据,并且由于隐私问题而无法公开。因此,只有数量有限的团队可以在内部访问这些数据和数据之上的研究。其他公共数据集是可用的,但数量有限,无法真正训练出优于标准基准的模型。然而,一些机构正在缓慢地试图解决这一差距。这将有助于独立研究人员和研究生探索新颖的想法。此外,如果没有仔细管理用于训练模型的数据集,这些深度学习算法通常会受到有偏见或错误预测的影响。
因此,应制定法规和标准,以使用专家知识和一致的措施验证这些结果。我们还看到人们对可解释的人工智能和DL技术的可解释性方法感兴趣,这些方法可以解释这些“黑箱”模型,并改善人类人工智能在新发现方面的协作。
微信号|IEEE电气电子工程师
新浪微博|IEEE中国