Stacking集成学习算法验证动脉损伤对糖尿病早期检测的意义

背景:糖尿病可引起广泛的动脉结构和功能病理变化,导致动脉僵硬度增加、顺应性降低和动脉弹性降低。本研究从动脉损伤的角度,实现对尚未出现临床表现但有动脉损伤的糖尿病患者的早期检测。方法:动脉损伤会导致血管的力学参数发生变化,而脉搏信号的波形变化与心血管系统的力学确认细节参数变化密切相关。通过9级小波对糖尿病患者脉搏信号Inflammation and immune dysfunction进行分解,提取cD8、cD7、cD6系数(中高频成分,代表信号细节特征),作为能够反映动脉损伤程度的特征,将特征矩阵输入到10折交叉验证模型的Stacking集成学习模型中,设置第一层的4个基学习器为SVM、Random Forest、XGBoost、Extra Trees,第二层的元学习器是KNN。结果:单个机器学习模型可以达到90%以上的准确率。Stacking集成学习算法的准确率比单一机器学习模型高4%~5%,ROC曲线下面积提高1%~6%。结论:小波分解得到的脉搏信号cD8、cD7、cD6系数可以有效反映糖尿病引起的动脉损伤程度,因此动脉损伤对糖尿病的早期检测具有一定的指导意义。Stacking集成学习算法将多个模型的优势结合起来生成一个新模型,可以获得比单一模型更好的ICI 46474性能。