适应性选择是影响人类表型发展和分化以及种族人群之间疾病易感性差异的主要因素之一。基因组中非编码元件占据超过98%的区域,和蛋白编码元件一样,非编码元件在表型塑造过程中发挥重要作用。近年来,人类基因组范围的非编码调控元件如增强子、启动子得到了系统的鉴定与注释,然而这些非编码调控元件在人群适应性选择中所扮演的角色仍缺乏系统的研究。
近日,"女娲"基因组团队在《Molecular Biology and Evolution》杂志上进一步推出题为"Adaptive Selection of Cis-regulatory Elements in the Han Chinese"的研究论文,重点阐释了适应性选择下非编码调控元件对表型演化的影响。研究结果发现汉族人群常染色体基因组区域大约12%的区域受到适应性选择的影响,约有15%的非编码调控元件(启动子和增强子)受到适应性选择作用,这一比例相对于蛋白编码基因略低。通过对经历适应性选择的调控元件的靶向基因的功能富集分析发现,正选择调控元件主要富集在细胞黏合等生物学通路,而平衡选择调控元件主要富集在免疫相关通路。基因组中的古人类渗入事件一直备受关注,该研究通过进一步定位正选择的古人类基因渗入区域,发现这类事件集中在3p13.11区域,且该区域内的调控元件主要与紫外辐射适应有关。其中关键的靶向基因为HYAL基因,编码透明质酸酶以降解透明质酸。皮肤中透明质酸可以有效帮助个体抵御紫外辐射。结合表观基因组注释发现,尼安德特人在HYAL1基因增强子区域渗入的一个变异,大幅降低了该增强子对CTCF等介导染色质三维互作的转录因子的结合能力,从而降低了增强子的远程调控效率,使得HYAL1基因表达水平显著降低。因此携带该变异的个体的皮肤可以维持更高的透明质酸含量,获得更好的紫外辐射抵御能力。除此之外,透明质酸也是一种促进伤口愈合的物质,某种程度上该尼安德特人增强子的渗入也可以促进东亚人群伤口愈合能力。通过对伤口愈合通路中基因的非编码调控元件的适应性选择进行分析,同样揭示了东亚人群伤口愈合能力增强经历的正向选择。基因组中正选择对疾病风险基因的影响也是重要的进化问题。该研究团队通过分析正选择位点对连锁的疾病风险基因的影响,发现几乎一半的疾病风险基因在正选择作用下加速淘汰,还有一半的疾病风险基因在正选择作用下清除效率减缓。
图:汉族人群基因组中的适应性选择
综上所述,"女娲"基因组团队进一步将人群基因组进化的研究重点落在了很少被关注的非编码调控区域。在该研究中,研究团队通过系统地鉴定基因组范围的适应性选择,揭示了非编码调控元件的适应性选择对人群表型的影响。此前女娲基因组项目基于大规模汉族人群全基因组测序数据,绘制了中国汉族人群的SNP和InDel (Cell Reports, 2021),STR (Nature Communications, 2023),MEI (Nucleic Acids Research, 2022) 的全基因组变异图谱,也对中国汉族人群近期的适应性选择进行了分析(Science Bulletin, 2023)。
中国科学院大学生命学院博士生刘帅和中国科学院生物物理研究所罗华夏副研究员为该论文的共同第一作者,中国科学院生物物理研究所徐涛院士、何顺民研究员为论文的共同通讯作者。该研究工作得到了国家重点研发计划、中国科学院战略性先导科技专项、国家自然科学基金、国家基因组科学数据中心等多个项目的支持。
文章链接:https://doi.org/10.1093/molbev/msae034
(供稿:健康大数据中心)