大规模蛋白质组学研究能够深化对健康和疾病的理解,但现有研究仍集中于有限的疾病结局,蛋白与健康和疾病之间的关系仍然存在许多未解之谜。疾病相关的蛋白质是特异性的还是共同的,这些蛋白质能否启示疾病的生物学分类?它们能否作为疾病预测和诊断的生物标志物及潜在的治疗靶点?
2024年11月22日,来自复旦大学附属华山医院的郁金泰、毛颖团队联合复旦大学类脑智能科学与技术研究院程炜、冯建峰团队合作研究,在Cell上发表题为Atlas of the plasma proteome in health and disease in 53,026 adults的文章。
论文全面绘制了人类健康与疾病蛋白质组图谱,并结合人工智能大数据分析方法构建了疾病诊断预测模型以及发现了26个药物治疗新靶点,为精准医学的实施提供了重要科学依据。
研究通过深入分析53,026名个体的血浆蛋白质组数据,纳入了2,920种血浆蛋白质与406种既往患病、660种随访新发疾病以及986种健康相关特征,跨越了14.8年的中位随访期,揭示了168,100个蛋白质-疾病关联和554,488个蛋白质-表型关联。研究中发现超过650种蛋白质与至少50种疾病存在联系,而超过1000种蛋白质表现出性别和年龄的异质性,这些发现深化了对疾病间共享和特异分子机制的理解,揭示了不同人群在疾病易感性上的差异。
人类健康与疾病血浆蛋白质组图谱
研究发现免疫系统相关通路在绝大部分疾病中富集,强调了炎症在人类健康中的重要作用。对不同疾病之间的生物学通路的比较完善了对疾病病理生理学相似性和异质性的理解。例如, AD和血管性痴呆(VaD)相关的蛋白质在与神经系统相关的共同通路中富集,而AD特异性通路大多与脂质代谢有关,VaD特异性通路与心肌有关。此外,利用蛋白质组学特征对660种疾病进行聚类,研究者根据共享的生物学特性将这些疾病联系起来,例如,各种痴呆亚型被划分到同一疾病亚群,该亚群还包含精神、内分泌、心血管等系统疾病,基于此,研究团队进一步揭示了该亚群的特征性生物学功能,有助于解释为何患者身上会同时出现看似不相关的症状,并进一步加深对机制的理解和提高治疗的有效性。
随后,使用机器学习算法,研究团队识别出了具有潜在诊断和预测价值的生物标志物,发现基于蛋白质的模型在183种疾病中的AUC值超过0.80,明显优于基于人口统计学的模型,将有助于提高疾病的早期诊断率。同时, GDF15被发现是预测和诊断多种疾病的关键蛋白,其在对200种疾病的预测中的重要度均排名第一,EDA2R、NTproBNP、COL9A1和NEFL等蛋白也在多个疾病中表现出良好的预测和诊断性能,表明它们在多种生物过程中发挥着核心作用,具有广泛的临床应用潜力。
蛋白质在疾病预测和诊断中的性能(A-B.血浆蛋白、人口统计学及综合模型预测[A]和诊断[B]疾病的AUC值;C-D.蛋白质在疾病预测[C]和诊断[D]中的重要度排序)
进一步整合蛋白质数量性状位点(pQTL)和疾病全基因组关联研究(GWAS)数据,孟德尔随机化分析(MR)确定了474个具有潜在因果关联的蛋白质-疾病对,其中与神经精神疾病相关的蛋白质有18个。通过检索DrugBank和Therapeutic Target Database两个数据库中的药物靶点信息,本研究提供了对25个已知靶点的37种潜在药物重新利用机会,如将BSG重定位作为治疗抑郁症的潜在靶点。最后,通过对MR发现的潜在靶点进行安全性评估,本研究确立了26个具有治疗潜力且安全性良好的新靶点。
为了进一步推动科学研究和精准医疗的发展,本研究建立了一个可开放访问的蛋白质组-表型组资源数据库Proteome-Phenome Atlas(https://proteome-phenome-atlas.com/),可开放获取所有研究结果。
Proteome-Phenome Atlas数据库首页
综上所述,本研究绘制了迄今为止最全面的人类健康与疾病蛋白质组图谱,揭示了血浆蛋白在疾病诊断、预测和治疗中的潜在应用价值。
研究为临床实践提供了科学依据,有助于疾病的早期检测、精准分层和个性化治疗。未来,基于这一开放获取的蛋白质组学图谱,研究人员将能够更深入地探索疾病发病机制,推动生物标志物和预测/诊断模型开发,并探寻全新治疗靶点,为精准医学发展奠定了基础。
大规模蛋白质组学研究能够深化对健康和疾病的理解,但现有研究仍集中于有限的疾病结局,蛋白与健康和疾病之间的关系仍然存在许多未解之谜。疾病相关的蛋白质是特异性的还是共同的,这些蛋白质能否启示疾病的生物学分类?它们能否作为疾病预测和诊断的生物标志物及潜在的治疗靶点?
2024年11月22日,来自复旦大学附属华山医院的郁金泰、毛颖团队联合复旦大学类脑智能科学与技术研究院程炜、冯建峰团队合作研究,在Cell上发表题为Atlas of the plasma proteome in health and disease in 53,026 adults的文章。
论文全面绘制了人类健康与疾病蛋白质组图谱,并结合人工智能大数据分析方法构建了疾病诊断预测模型以及发现了26个药物治疗新靶点,为精准医学的实施提供了重要科学依据。
研究通过深入分析53,026名个体的血浆蛋白质组数据,纳入了2,920种血浆蛋白质与406种既往患病、660种随访新发疾病以及986种健康相关特征,跨越了14.8年的中位随访期,揭示了168,100个蛋白质-疾病关联和554,488个蛋白质-表型关联。研究中发现超过650种蛋白质与至少50种疾病存在联系,而超过1000种蛋白质表现出性别和年龄的异质性,这些发现深化了对疾病间共享和特异分子机制的理解,揭示了不同人群在疾病易感性上的差异。
人类健康与疾病血浆蛋白质组图谱
研究发现免疫系统相关通路在绝大部分疾病中富集,强调了炎症在人类健康中的重要作用。对不同疾病之间的生物学通路的比较完善了对疾病病理生理学相似性和异质性的理解。例如, AD和血管性痴呆(VaD)相关的蛋白质在与神经系统相关的共同通路中富集,而AD特异性通路大多与脂质代谢有关,VaD特异性通路与心肌有关。此外,利用蛋白质组学特征对660种疾病进行聚类,研究者根据共享的生物学特性将这些疾病联系起来,例如,各种痴呆亚型被划分到同一疾病亚群,该亚群还包含精神、内分泌、心血管等系统疾病,基于此,研究团队进一步揭示了该亚群的特征性生物学功能,有助于解释为何患者身上会同时出现看似不相关的症状,并进一步加深对机制的理解和提高治疗的有效性。
随后,使用机器学习算法,研究团队识别出了具有潜在诊断和预测价值的生物标志物,发现基于蛋白质的模型在183种疾病中的AUC值超过0.80,明显优于基于人口统计学的模型,将有助于提高疾病的早期诊断率。同时, GDF15被发现是预测和诊断多种疾病的关键蛋白,其在对200种疾病的预测中的重要度均排名第一,EDA2R、NTproBNP、COL9A1和NEFL等蛋白也在多个疾病中表现出良好的预测和诊断性能,表明它们在多种生物过程中发挥着核心作用,具有广泛的临床应用潜力。
蛋白质在疾病预测和诊断中的性能(A-B.血浆蛋白、人口统计学及综合模型预测[A]和诊断[B]疾病的AUC值;C-D.蛋白质在疾病预测[C]和诊断[D]中的重要度排序)
进一步整合蛋白质数量性状位点(pQTL)和疾病全基因组关联研究(GWAS)数据,孟德尔随机化分析(MR)确定了474个具有潜在因果关联的蛋白质-疾病对,其中与神经精神疾病相关的蛋白质有18个。通过检索DrugBank和Therapeutic Target Database两个数据库中的药物靶点信息,本研究提供了对25个已知靶点的37种潜在药物重新利用机会,如将BSG重定位作为治疗抑郁症的潜在靶点。最后,通过对MR发现的潜在靶点进行安全性评估,本研究确立了26个具有治疗潜力且安全性良好的新靶点。
为了进一步推动科学研究和精准医疗的发展,本研究建立了一个可开放访问的蛋白质组-表型组资源数据库Proteome-Phenome Atlas(https://proteome-phenome-atlas.com/),可开放获取所有研究结果。
Proteome-Phenome Atlas数据库首页
综上所述,本研究绘制了迄今为止最全面的人类健康与疾病蛋白质组图谱,揭示了血浆蛋白在疾病诊断、预测和治疗中的潜在应用价值。
研究为临床实践提供了科学依据,有助于疾病的早期检测、精准分层和个性化治疗。未来,基于这一开放获取的蛋白质组学图谱,研究人员将能够更深入地探索疾病发病机制,推动生物标志物和预测/诊断模型开发,并探寻全新治疗靶点,为精准医学发展奠定了基础。