北京基因组所(国家生物信息中心)合作开发基于基因遗传信息预测冠心病患病风险的新模型
为实现对个体未来罹患冠心病风险的精准预测,中国科学院北京基因组研究所(国家生物信息中心)汪敏先研究组与美国博德研究所(Broad Institute of MIT and Harvard)Amit V. Khera研究组合作,在利用冠心病单族裔及单疾病遗传关联信息的模型基础上,进一步开发整合不同族裔人群背景及多个冠心病临床危险因素信息的全基因组多基因风险评分新模型——GPSmult。该模型预测的准确性超过了美国临床预防医学领域用于评估个体动脉粥样硬化性心血管疾病患病风险的“金标准”——美国心脏病学会/美国心脏协会合并队列方程组(American College of Cardiology/American Heart Association Pooled Cohort Equations),大幅提高了利用基因组遗传信息预测个体未来患冠心病风险的准确度,能够进一步改善约40%个体的风险预测准确性。相关研究成果于7月7日以“A multi-ancestry polygenic risk score improves risk prediction for coronary artery disease”为题在国际顶尖期刊《自然医学》(Nature Medicine)发表。该成果有望在冠心病高风险人群的早期识别及精确分层上发挥作用,促进冠心病精准防治。
冠心病是导致人类死亡的最主要疾病之一,受个体遗传、代谢及不良生活方式的共同影响,其中遗传因素的影响约为40%~60%。由于个体基因信息在一生中基本保持不变,并且早在婴幼儿时期即可通过血液或唾液等无创方式采集获得,因此GPSmult模型能够在生命最早期基于个体基因信息预测其未来发生冠心病的风险,从而为尽早预防与干预疾病争取了广阔的时间窗口。
利用来源于冠心病全基因组关联研究国际联盟的全球多个族裔人群近27万例冠心病患者和118万例健康人群的全基因组对比关联研究结果,该模型首先分析了基因变异与疾病之间的相关关系,然后对全基因组范围内与疾病风险相关的所有遗传变异位点进行建模整合。为提高模型预测准确性,进一步整合了基因变异与十种冠心病临床危险因素及关联共病之间的关联关系,使用样本数超过了1346万例(图1)。在多族裔人群背景、总计超51万人的独立验证人群中,对新模型的准确性进行了全面评估,与当前已发表的27种基于全基因组信息预测冠心病风险的模型相比,新模型的准确性均有显著提升。
图1. 模型架构及训练与验证示意图
将英国生物银行(UK Biobank)中的30.8万欧洲人群依据GPSmult评分从小到大平均分为100组,统计每组内实际发生冠心病的人数比例。结果显示,GPSmult模型计算出的多基因风险评分与疾病风险之间具有显著的相关性,得分最低的组内冠心病的发生率小于0.6%,然而得分最高的组内冠心病的发生率高达16.3%,两组之间疾病的实际发生率相差近27倍(图2)。
图2. 冠心病患病风险与多基因风险评分分布之间的关系
在目前的心血管病预防指南中,推荐对既往有过冠心病、外周动脉疾病、缺血性卒中、糖尿病或严重高胆固醇血症病史的个体使用他汀类药物治疗,以帮助降低心血管疾病再次发生的风险和死亡率。回顾分析英国生物银行中30.8万欧洲人群长达 12年的随访跟踪数据,位于GPSmult评分分布前3%的个体,尽管个体没有上述既往病史,其冠心病的发生风险与已有疾病史的个体几乎相当(图3)。
图3. GPSmult识别的3%高风险个体发病风险与有既往病史的个体疾病风险相当
美国心脏协会/美国心脏病学会合并队列方程主要利用血脂、血压、年龄及性别等传统心血管疾病危险因素建模,预测个体未来10年的动脉粥样硬化性心血管疾病风险。而GPSmult基于个体基因信息预测先天疾病风险,将两种模型整合使用预测效果更优。通过对英国生物银行中32.6万多族裔人群的数据分析显示,在传统风险模型的多个疾病风险分层中,GPSmult均能进一步增强对个体患病风险的预测,且广泛适用于不同遗传背景的个体,特别是对南亚人群或者是传统危险分层处于高风险(风险大于20%)的个体,其增强效果更加明显(图4)。
图 4. GPSmult与基于传统危险因素的合并队列方程联合使用效果。在传统风险模型的多个疾病风险分层中,GPSmult均能进一步增强对个体患病风险的预测
北京基因组研究所(国家生物信息中心)汪敏先研究组长期致力于利用人群队列遗传大数据解析冠心病等心血管复杂疾病的遗传基础与机制,预测疾病未来发生风险。除利用基因遗传信息外,研究组正在开展利用人脸、眼底照片、计算机断层(CT)扫描和核磁共振等相关影像数据,开发人工智能模型,从医学影像学数据中提取疾病风险特征,从而表征和量化个体后天风险,整合先天遗传和后天环境因素等生命周期多阶段信息开发更加精准的风险预测模型,开发针对中国人群优化适用的疾病风险预测新模型,促进个体健康管理。
该研究由中科院北京基因组研究所(国家生物信息中心)、美国博德研究所(Broad Institute of MIT and Harvard)、麻省总医院(Massachusetts General Hospital)、哈佛大学医学院(Harvard Medical School)和斯坦福大学医学院(Stanford University School of Medicine)等机构共同合作完成。麻省总医院的Aniruddh P. Patel博士与北京基因组研究所(国家生物信息中心)汪敏先研究员为并列第一作者,北京基因组研究所(国家生物信息中心)的汪敏先研究员和博德研究所的Amit V. Khera教授为本研究的共同通讯作者。