Nat. Commun. |一种使用多模态生物数据预测未来病理性tau蛋白积累的可解释的机器学习方法

近日，剑桥大学-加州大学伯克利分校-伯明翰大学联合团队在《Nature Communications》（影响因子IF=14.919）上发表了题为“A robust and interpretable machine learning approach using multimodal biological data to predict future pathological tau accumulation”的论文[1]。该论文提出了一种基于广义矩阵学习向量量化的轨迹建模方法通过结合多模态生物数据来预测病理性tau蛋白积累，根据tau蛋白积累对阿尔兹海默病（AD）患者进行分层，为针对AD早期阶段的临床试验设计提出了一种具有转化影响的精细分层和预测的方法。本文通信作者是剑桥大学的Zoe Kourtzi教授，第一作者是Zoe Kourtzi教授研究组的博士后Joseph Giorgio博士。

背景介绍

在临床表现之前，阿尔茨海默病(AD)的发展伴随着多种病理生理事件发生。这些事件始于β-淀粉样蛋白(Aβ)的沉积，促进了广泛的病理性tau蛋白积累，进而导致神经变性和认知障碍。量化这些相互作用对于建立导致AD开始和进展的事件机制解释至关重要。

大脑中Aβ斑块和神经原纤维tau异常的PET成像的可用性，使得研究人员能够在体内检测到AD神经病理学的核心特征，并在很大程度上支持了从Aβ到tau和神经变性的事件发生。鉴于这些发展，AD的分期已经从需要尸检进行病理验证的临床综合征诊断转变为反映生物标志物特征连续性的诊断。临床综合征分类框架将AD定义为从认知未受损状态（即认知正常：CN）到轻度认知障碍(MCI)状态到AD痴呆的过渡。然而，这些临床综合征定义对AD的潜在病理学既不特异也不敏感。相比之下，最近提出的NIA-AA 2018的生物学框架提供了一个使用在单个时间点采集的生物标志物的目标分类框架。

为了在这个生物学框架内将个体分类为AD，连续的生物标志物被分类指定为阳性或阴性。具有Aβ和tau阳性生物标志物的个体被定义为患有AD，并且神经变性的阳性生物标志物用于提供有关疾病阶段的信息。为了对Aβ生物标志物进行二分法，大型AD队列研究表明，Aβ PET与示踪剂呈双峰分布并研究衍生的特定概率阈值。然而，这些方法有以下几种特点：

1. 单一阈值并未考虑低于β-淀粉样蛋白阳性阈值但仍可能遵循随后的AD轨迹的个体，这限制了仅将β-淀粉样蛋白作为未来生物标志物变化预测因子的敏感性。

2. tau的时空模式被证明与未来的神经退化和认知衰退密切相关。

3. 临床试验受到样本异质性的阻碍，这降低了评估治疗结果的敏感性。

因此，需要创新的建模方法来整合Aβ、tau和神经退行性变的连续地形模式，以准确对患者进行分层以纳入试验，从而降低样本异质性并提高试验疗效。

机器学习的最新进展促进了神经退行性疾病的预测模型的开发，预测模型可以挖掘多模态数据集，包括来自大型患者队列的临床综合征、认知和神经病理学的测量。迄今为止，AD中的大多数机器学习模型都利用了在临床综合征定义框架下启动的丰富纵向队列的信息。这些研究主要集中在综合征诊断的离散变化和基于临床标签的纵向变化转换为AD时间的概率估计。同时利用纵向综合征标签和连续生物标志物信息的建模方法在改善AD中纵向生物过程的预测中具有很大潜力，弥合生物学和综合征框架之间的差距。

本文采用基于机器学习的轨迹建模方法来量化关键生物标志物（Aβ、tau、内侧颞叶萎缩）和APOE 4基因型之间的多元关系，以及晚发性AD的主要遗传风险因素。本文使用综合征定义中离散纵向变化来训练模型，以将临床上稳定的个体与处于AD早期阶段的个体区分开来。同时，本文还得出了一个量化个体与临床稳定原型的距离的连续预后指数，并证明了该预后指数：(a) 在症状出现之前就可以预测未来tau积累的个体化率，(b) 对未来最有可能积累tau的人群进行重新分层，工作流程图如图1所示。

图1 GMLVQ-scalar projection模型和验证分析的工作流程图

数据和方法

本文使用了三个不同的队列数据用于模型训练和测试，详细信息如下：

ADNI2/GO：437个样本(AD临床综合征:181, 临床稳定:100, 临床下降:156)，用于训练模型

ADNI3：115样本（CN: 72, MCI: 43），用于测试标量映射与tau积累关系

BACS：56个样本，用于测试区域未来tau累积预测的准确性

本文使用该团队之前开发的一种基于广义矩阵学习向量量化（GMLVQ）分类框架的机器学习方法：GMLVQ-Scalar Projection[2]。这种方法通过训练基于纵向诊断标签的模型来导出连续的预后指标（即标量投影）。其中，学习向量量化(LVQ)是分类器，它以有监督的方式运行，以迭代地修改特定于类的原型以找到离散类的边界。而广义矩阵LVQ (GMLVQ)利用完整度量张量扩展了LVQ，以在输入空间中实现更稳健的（相对于分类任务）距离测量。为此，度量张量在其对角元素中引入特征缩放，同时考虑特征对（输入空间的坐标）之间的任务条件交互。使用基线多模态数据（内侧颞叶灰质密度、Aβ、APOE 4基因型）训练了GMLVQ模型，并表明GMLVQ建模方法将MCI患者分类为具有高特异性和敏感性的亚组。在这里，本文将相同的框架应用于新样本，得出临床稳定与临床下降的标量投影，并对临床下降人群中未来的区域tau积累进行个性化预测。

方法的主要步骤包括转换特征空间、投影、归一化，具体如下：

首先，通过度量张量将样本向量xi和表型w(Clinically stable, Clinically Declining)转换到一个特征空间。

然后，以W(Clinically Stable)为中心坐标系，并在该坐标系中计算每个向量xi到向量W(Clinically Declining)

W(Clinically Stable)的正交投影。

最后，对原型W(Clinically Stable)的位置投影进行归一化。

结果分析

3.1 从多模式生物标志物推导出预后指数

本文使用随机重采样将ADNI2/GO样本拆分为训练集和测试集，用以证明本文模型对临床稳定个体与临床下降个体进行分类，其中交叉验证的类平衡准确度为88%（敏感性87%，特异性91%）。此外，本文还测试在了BACS样本的MRI场强差异是否对多模态标量投影引入了系统偏差。比较内侧颞叶灰质密度和标量投影的拟合残差的双样本检验显示，BACS中1.5 T和3 T MRI 之间没有显着差异，表明本文模型的多模式方法在MRI采集的差异上是稳健的。最后，对于 ADNI3 样本，本文测试了基于基线多模态生物标志物的标量投影的分类是否与基线综合征临床诊断相似。比较临床稳定与 CN、临床下降与 MCI 的分类表明一致性与偶然性没有显着差异。也就是说，基于临床医生的综合征诊断和生物标志物衍生的多模态标量投影对于区分临床稳定和临床下降的一致性较差，这表明AD的横断面综合征定义在捕捉可预测临床衰退的潜在病理生物学方面是有限的。

3.2 与其他模型对比

首先，本文GMLVQ模型预测临床稳定和临床下降的准确度与标准线性支持向量机预测的准确度一致，均达到了88%。本文使用GMLVQ而非SVM，因为它自然地提供了类原型和一个具有适当度量（到原型的距离）的子空间，可以使用标量投影方法得出预后指数，可视化结果，具有一定的可解释性。

其次，本文将基于基线生物标志物数据的轨迹建模方法与潜在时间联合混合效应模型 (LTJMM) 进行了比较，LTJMM 先前已被证明可以基于纵向生物标志物数据推断疾病阶段。结果观察到LTJMM潜在时间偏移与本文的预后指数之间存在正相关关系，表明仅使用基线数据得出的标量投影与LTJMM衍生的疾病阶段相关。并且LTJMM需要纵向数据来模拟疾病轨迹并拟合个体化参数，从而限制样本外的泛化。而本文的建模方法自然地从基线数据中得出这些样本外预测，因为本文提供了个性化的指标和特征，而不是构建个性化的模型。

3.3 其他结论

A. 临床衰退的个体比临床稳定的个体积累tau蛋白更快。

B. 与认知能力相比，检测tau蛋白积累的有意义变化所需的患者更少。

C. 使用多模态生物标志物减少了样本量，可以检测tau蛋白积累的有意义的变化。

D. 预后指数可以预测无症状和轻度受损样本中区域tau积累轨迹的个体变异

E. 在一个独立的无症状样本中，可以准确地预测单个病理性tau蛋白积累的轨迹

结语

本文采用一种稳健且透明的机器学习方法来结合AD生物标志物的连续信息，并预测AD无症状和轻度受损阶段tau积累的病理变化。使用特征明确的AD生物标志物（Aβ、内侧颞叶灰质密度、APOE 4）来推导预后指数，引入了一种轨迹建模方法，该方法优于基于综合征标签的二元患者分层。使用源自多模式基线数据的预后指数来预测未来的tau积累，是AD进展的已知病理驱动因素。结果表明，与单独的Aβ状态或临床综合征标签相比，这种未来tau积累的多模式预后指数是一种更敏感的患者分层工具。此外，本文的预后指数预测CN个体中tau积累的个体化空间特异性变化，从而能够在AD的无症状阶段（即临床症状出现之前）进行精细分层和分期，从而促进了对AD进展机制的理解，并对临床试验的设计具有潜在的影响。

本文的方法与临床试验的设计具有的潜在相关性。首先，本文证明了多模态建模方法在捕获早期AD相关病理学方面比基于基线综合征标签的分类更敏感。其次，与金标准认知工具 (PACC) 相比，使用tau积累率作为测量结果可将用于检测AD早期具有临床意义的变化的样本量减少31%。第三，仅使用本文的多模态预后指数与Aß状态相比，将观察到病理性tau积累的临床有意义变化所需的样本量减少了44%。第四，本文的轨迹建模方法表明，基线非tau生物标志物与短期内tau积累率之间存在线性关系。

未来的工作需要扩展方面。首先，对内侧颞叶灰质密度的测量很可能捕获了典型失忆AD人群特有的信息，因为它是使用 ADNI 数据得出的。萎缩的其他措施可能有助于更大规模的预测模型。其次，专注于特定的经过充分研究的生物标志物（即Aß、内侧颞叶灰质密度和APOE 4）以做出可靠的预测。第三，线性建模方法侧重于来自CN和MCI个体的数据，捕捉了有限时间跨度（即3年）内tau积累的最早变化。第四，通过在独立的CN样本中测试预测来验证该模型。

参考资料

Giorgio, J., Jagust, W.J., Baker, S. et al. A robust and interpretable machine learning approach using multimodal biological data to predict future pathological tau accumulation. Nat Commun 13, 1887 (2022).

https://doi.org/10.1038/s41467-022-28795-7

Giorgio, J., Landau, S.M., Jagust, W.J., Tino, P., Kourtzi, Z. and Alzheimer's Disease Neuroimaging Initiative, 2020. Modelling prognostic trajectories of cognitive decline due to Alzheimer's disease. NeuroImage: Clinical, 26, p.102199.