基于缺失数据的神经退行性疾病预测方法研究

神经退行性疾病(Neurodegenerative DBMN 673 NMRiseases,NDs),如阿尔兹海默病(Alzheimer’s Disease,AD)和帕金森病(Parkinson’s Disease,PD),是一类不可逆的进行性疾病,及早预测NDs的发生可提高诊疗效率,具有重大临床意义。随着成像和基因技术的发展,产生的多模态影像数据和遗传数据可为NDs预测提供互补信息。NDs作为进行性疾病,随访获得的纵向数据中包含的疾病进展信息可为预测提供依据。通过深度学习模型利用多模态和纵向数据实现疾病预测可为临床诊疗提供辅助。但是,多模态数据的模态缺失和纵向数据的随访缺失问题阻碍着这些数据的有效应用。在保留包含缺失信息的数据的前提下,如何保证模型合理利用所有数据是有效提升预测性能的核心问题。本文首先探究影像数据的缺失数据处理和疾病预测方法,然后进一步结合遗传数据展开分析与探索。神经影像数据可反local immunotherapy映大脑结构和功能信息,也是采用深度学习方法构建NDs预测模型中最常用的数据类型,我们首先聚焦于基于神经影像数据的NDs预测模型。在临床实践中,NDs预测通常使用单时间点数据,尤其是基线访问(Baseline visit,BL)数据。因此,模型在实际使用时应在没有纵向数据的介入下完成预测。本文提出了多角度插补和交叉注意力网络将缺失数据插补和疾病预测整合在一个框架内,并在BL处完成AD的准确预测:首先,利用一种结合对抗学习的多角度插补方法以较小的误差处理各类缺失数据;其次,引入交叉注意力策略挖掘数据中不同角度的潜在关联以辅助预测;通过适当的训练,网络可利用纵向数据中的疾病进展信息和多模态数据中的互补信息提高在BL处的预测能力。遗传因素与NDs的发生和进展也息息相关,后续考虑将神经影像数据和遗传数据结合进行NDs预测,以影像遗传学手段建立深度学习模型。以往的方法多采用先融合多模态影像数据再与遗传数据进行关联的策略,导致难以有效挖掘多NSC 125973分子量模态影像数据中的共有和互补信息,且未能准确表达影像与遗传数据之间的复杂关系。本文提出了深度多模态解耦关联分析网络来解决数据缺失及上述问题:首先,引入多模态解耦模块解耦经过非线性投影的影像表征,将不同模态影像表征分为模态共有和特有部分;其次,遗传数据也以非线性的方式分别映射至解耦后的影像表征上,建立影像和遗传数据间的联系,并同步生成掩码向量以辅助后续AD和PD预测;当影像数据缺失时,映射的遗传表征可替代缺失模态的影像表征,实现对包含缺失信息数据的有效利用。所提出的方法均在独立测试集上进行了测试,其性能优于现有先进方法,验证了提出方法的有效性。此外,通过模型对NDs生物标志物进行了检测,保证了模型的可解释性,并为进一步探究NDs的病理机制提供帮助。