近日,NIHR Barts生物医学研究中心的研究人员分析了100多万欧洲人的基因组数据,并将遗传信息与血压数据结合,通过全基因组关联分析的方法,发现了535个与血压相关的遗传变异新位点。遗传风险评估结果显示,遗传风险高的人群血压比遗传风险低的人群平均高13 mmHg。此外,带有这些遗传变异的人患有高血压的风险会升高3.34倍。这项研究极大扩充了目前已知与血压相关遗传变异位点的集合,提出了与血压相关的新的生物学通路以及新药靶。
该研究发表在2018年9月《Nature Genetics》杂志,题目为“Genetic analysis of over 1 million people identifies 535 new loci associated with blood pressure traits”。
全基因组关联分析采用两阶段研究策略,第一阶段通过基因分型筛选出候选易感位点,第二阶段在独立样本群体中进行验证。
该研究第一阶段纳入了UK Biobank中大约45万人基因组及血压数据,以及来自ICBP(International Consortium of Blood Pressure Genome Wide Association Studies)研究中大约30万人的数据。
第二阶段的验证人群加入了来自MVP(US Million Veteran Program)项目的22万人以及EGCUT(Estonian Genome Centre, University of Tartu Biobank)中3万人的基因及血压数据。
通过meta分析,本研究共发现了901个突变位点与血压相关,其中有535个新位点,可以解释约27%的血压遗传度。
将901个突变位点与血压相关生活方式进行关联分析,结果发现,血压与日常水果摄入量,尿钠和肌酐浓度,体质量指数(BMI),体重,腰围,咖啡因、茶和水摄入量相关(P = 1.0×10-7至P = 1.3×10-46)。
值得一提的是,SLC39A8基因上的一个SNP位点(rs13107325)是一个与饮酒频率(P = 3.5 × 10−15)、看电视时间(P = 2.3 × 10−11)、BMI(P = 1.6 × 10−33)、体重(P = 8.8 × 10−16)以及腰围(P = 4.7 × 10−11)相关的新位点。
文章中采用无监督层次聚类的方法展示了血压相关的位点,有36个位点至少与一种生活方式具有相关性。
对901个与血压相关的位点进行遗传风险分数(GRS,genetic risk score)计算,发现所有的遗传变异都与血压升高13 mm Hg有关。遗传高风险人群比遗传低风险人群患高血压的几率高3倍以上,且患卒中、心肌梗塞和突发心血管疾病的可能性更高。
新遗传变异位点相关的基因及功能分析不仅与经典血压通路相关,还发现更多调控通路信号。
553个新位点中有77例与其它疾病或者生理特征相关,例如,APOE基因已知与脂质水平、心血管疾病以及阿尔兹海默症相关[1],在本研究中首次发现与血压高度相关,提示心血管与认知水平存在密切关系。
此外,TGFβ通路中的几个基因位点,例如SMAD家族基因和TGFβ基因本身对血压具有重要调控作用,这条通路是调控肾脏中钠处理和心室重构,最新研究表明血浆中TGFβ水平与高血压相关[2]。
研究还发现,血压相关基因在肾上腺组织表达明显富集,认为5%~10%的高血压患者是由于肾上腺产生过量原发性醛固酮导致,对于有耐药性的高血压患者,这一比例可达20%左右。
这项研究也提示了药物开发的潜在新靶点,一些用于治疗其他疾病的药物或许可用于高血压的治疗,如新发现的SLC5A1是2型糖尿病药物canagliflozin的靶点。赋予已知的安全药物新的适应证可能是解决当前表现出耐药性或不耐受患者的一种快速经济有效的方法。
研究局限
1
本文将901个与血压相关位点在非洲人群和南非人群中进行了独立观察,虽然对大部分的位点都发现了与欧洲人群一致的变化方向,但由于人群数目较少(7782例非洲个体,10323例南非个体),会使得效应量(effect size)降低30%到40%。
2
部分在第一阶段人群中发现的显著相关位点并未在第二阶段独立人群中验证,因此可能需要进一步重复或者采用更大样本量。
可借鉴之处
本项GWAS研究在验证阶段采用了两步骤分析流程:
首先将初始人群中发现的显著位点在MVP和EGCUT共25万左右人群中进行验证,随后将初始阶段的75万人加入,共计100万人进行meta分析。
对于那些在该验证阶段中未得到重复结果的位点,再在UKB-ICBP人群中进行内部验证。
本项研究在验证阶段采用了分布式分析方法,并充分利用meta分析的优势。
结论:当GWAS研究验证阶段人群样本量不足时,可以借鉴该方法。
本期关键词
效应量(Effect Size,ES)
在一般统计分析中,我们只报告统计显著性,即P值,以表达研究发现的差异并不是侥幸得来的。不过,单靠统计显著性,不代表在实践中的重要性。举例来说,一个减肥药对体重减少表现出统计显著相关,但如果是在3个月期间减少3公斤,该药物并不是那么有效,如果只关注体重减少与其P值,可能就高估药效。而ES是衡量处理效应大小的指标,与显著性检验不同,这些指标是不受样本容量影响的。它表示不同处理下的总体均值之间差异的大小,可以在不同研究之间进行比较。在平均数检验中ES表示的是两组样本分布的总体的非重叠程度;ES越大,重叠程度越小,效应明显;ES越小则相反。因此,很多期刊会要求作者对研究结果进行统计显著性检验外,还要有效应量及95%的置信区间。
参考文献
1.Sofat, R. et al. Circulating apolipoprotein E concentration and cardiovascular disease risk: meta-analysis of results from three studies. PLoS Med. 13, e1002146 (2016).
2.Nakao, E. et al. Elevated plasma transforming growth factor β 1 levels predict the development of hypertension in normotensives: the 14-year follow-up study. Am. J. Hypertens. 30, 808–814 (2017).
本期嘉宾
杨欣壮
生物信息学,北京大学硕士、博士。北京协和医院-中心实验室-统计与生信平台。
北京协和医院-中心实验室-统计与生信平台基于循证医学、医学统计学、生物信息学(基因组、转录组、表观遗传组、微生物)等前沿技术,在院内开开展方法学咨询与大数据分析技术支持。从疾病的病因、诊断、治疗、预后等多角度开展临床研究,为疾病的预防、早期干预、新药和新治疗方法的临床应用提供科学的证据支持,促进转化医学发展与科研成果转化。
栏目策划
吴志宏教授
北京协和医院骨科教授、博导、中心实验室副主任、实验动物管理委员会主任、骨骼畸形的遗传学研究北京市重点实验室副主任、北京市生物医学工程高精尖中心学术委员会委员、医工整合联盟副理事长、中华医学会骨科分会基础学组委员。
版权声明:
协和医学杂志倡导尊重和保护知识产权。欢迎转载、引用,但需取得本平台授权。如您对文章内容版权存疑,请发送邮件medj@pumch.cn,我们会与您及时沟通处理。本站内容及图片仅供参考、学习使用,不为盈利且不作为诊断、医疗根据。