通过生物信息学和机器学习方法鉴定心房颤动中枢基因及其靶向药物

目的:目前心房颤动是最常见的心律失常,心房颤动的危害大且治疗效果欠佳,我们拟通过生物信息学方法联合机器学习算法,探索心房颤动患者的关键基因,并探寻在心房颤动治疗中具有潜在治疗作用的小分子化合物,为临床上心房颤动的诊断及治疗提供新靶点以及新药物。研究方法:在这项研究中,我们通过登入NCBI(National Center for Biotechnology Information)进入其中的基因表达合成(Gene expression omnibus,简称GEO)数据库中,下载了五组与心房颤动相关的基因表达数据集(GSE79768、GSE14975、GSE41177、GSE115574和GSE2240),其中GSE2240数据集选作为验证集,其余的四个数据集被用来作为训练集,用于深度分析。首先,使用R软件中的“limma”包在训练集中筛选出显著差异表达基因(Differential expression genes简称DEGs),同时在训练集中也进行加权基因共表达网络分析(Weighted gene co-expression network analysis,简称WGCNA)确定与房颤最显著相关的基因模块;其次,我们将显著差异表达基因和与房颤最显著相关模块基因取交集,将此交集基因考虑为心房颤动的相关基因(本文称为重叠基因),并进行了GO/KEGG功能富集分析、蛋白质-蛋白质相互作用网络分析、mi RNA-m RNA调控网络构建以及c MAP数据库小分子药物预测。接下来,我们使用三种常用的机器学习方法(LASSO、RF和SVM)来进一步筛选心房颤动最重要的相关基因(从重叠基因中进一步筛选出最相关的基因,简称为特征基因),并构建了由特征基因组成的房颤诊断预测模型,并在训练集和测试集中验证模型性能(曲线下面积及校准曲线)。此外,我们使用CIBOERSORT工具帮助了解特征基因与22种免疫细胞之间的相关性。最后,我们针对重叠基因(根据在房颤疾病中上下调关系)在c MAP数据库内部进行比对,寻找到一系列潜在小分子化合物,通过与特征基因的编码蛋白进行分子对接模拟,测试其结合可能程度。研究结果:(1)通过对本研究中训练集的基因进行差异表达分析,总共得到75个差异表达基因;(2)通过对本研究中训练集的加权基因共表达网络分析,一共得到15个基因模块,其中青色模块179个基因与心房颤动的负相关最强(r=-0.52,p=3e-10);(3)对青色模块的179个基因和差异性表达的75个基因合并取交集得到42个重叠基因,行GO富集分析显示这42个重叠基因在生物过程(BP)方面主要富集参与突触装配、典型Wnt信号通路的调控、典型Wnt信号通路、钙离子跨膜转运体活性的负调控、肌浆网钙离子转运等生物过程;KEGG分析显示这42个重叠基因显著富集在矿物吸收、甘油脂代谢、心肌收缩、CGMP-PKG信号通路、Wnt信号通路等;(4)对这42个重叠基因使用三种常用的机器学习方法进一步筛选(最小绝对收缩和选择算子(LASSO)算法、支持向量机递归特征消除(SVM-RFE)算法和随机森林(RF)算法),最终确定了ANGPTL2,C1orf105和DHRS9为心房颤动的最关键基因(即特征基因serum biomarker);(5)通过曲线下面积(AUC)展示单个特征基因预测房颤的准确性,在训练集中ANGPTL2、C1orf105和DHRS9的AUC分别为0.871(95%CI:0.801-0.930)、0.826(95%CI:0.749-0.896)和0.843(95%CI:0.761-0.914);在测试集中ANGPTL2、C1orf105和DHRS9的AUC分别为0.950(95%CI:0.860-1.000)、0.740(95%CI:0.515-0.930)和0.975(95%CI:0.910-1.000),表明这三个基因在内部及外部数据集中对房颤均具有良好的预测诊断性能;(6)免疫浸润分析https://www.selleck.cn/products/kd025-(slx-2119).html发现:ANGPTL2与CD8 T细胞和嗜酸性粒细胞相关;C1orf105与自然杀伤细胞活化、巨噬细胞M1、活化的树突状细胞和γδT细胞相关;DHRS9与肥大细胞的激活和失活有关;(7)在c MAP数据库中寻找到潜在治疗房颤相关小分子化合物:钙离子通道阻断剂VU-0413807-2,与ANGPTL2编码的蛋白进行分子对接模拟,同时设置阳性对照(已知ANGPTL2编码蛋白其中一Navitoclax生产商个靶点CACNA1G),氢键结合能及均方根误差都比阳性对照组好,显示出其能够结合我们的房颤关键靶点蛋白,从而起到治疗房颤作用。结论:1、本研究表明ANGPTL2、C1orf105和DHRS9可能在心房颤动中起关键作用;2、ANGPT2、C1orf105和DHRS9可能通过影响免疫细胞浸润而影响心房颤动的发生;3、发现小分子化合物VU-0413807-2可能通过ANGPT2,从而起着治疗房颤的潜在作用。