如何解开4%的基因组谜团?用上这种“老法子”就对了

2003年,人类基因组计划向世界揭示了人类DNA中的30亿个碱基对。从那时起,科学家们已经设计了许多方法来组织和评估这些庞大的信息。现在,美国冷泉港实验室(CSHL)的科学家们已经确定,进化的思想可以帮助我们理解这些结果。

研究人员已经得出结论,用来编码我们生长和完成各项生理功能所需的蛋白质的基因只占到人类基因组的1%。此外,他们还了解到,人类基因组中大约有5%的基因组在无数代的突变和进化过程中始终保持不变或保守。CSHL的计算生物学家和教授Adam Siepel解释说:“这表明,有4%的基因组正在做真正重要的事情,但是我们并不知道它们在做什么。”

为了解开百分之四的谜团,科学家们花了十多年的时间开发强有力的方法,在基因组的不同片段中寻找不同的功能。为了理解基因组对生物体有什么影响,他们必须从表观基因组中寻找证据。表观基因组是一系列化合物,它们附着在DNA上,影响着细胞如何以及何时使用该部分基因组。

从表观基因组中找答案使科学家能够猜测基因组的重要部分可能在什么部位,以及它们是否具有生物学功能。然而,这似乎比只看道具和服装就来确定是哪场戏剧更难。Siepel和同事Brad Gulko在最近出版的《自然遗传学》中提到:“这种对许多表观基因组测量的真实生物学意义的不确定性不仅是解释现有数据的一个关键障碍,而且对于未来决定要收集多少新数据、何种类型、以及以何种组合进行研究也是一个关键障碍。”

令人欣喜的是,Siepel实验室已经找到了解决这个障碍的方法。Siepel说:“我们决定从一个不同的角度来看这个问题。我们是不是可以让进化告诉我们基因组中有多少是重要的?以及我们从每个表观基因组数据集中学到了多少?”

研究人员利用现代人类群体的数据来寻找近期自然选择的证据。然后,他们比较了人类和黑猩猩的基因组,以获得可以追溯到五百万至七百万年前人类和现代类人猿分开时候的信息。Siepel解释说:“这让我们能够对整个时期自然选择的强度进行排序。”

这个结果可以作为一种指导未来研究的方法。根据进化历史,Siepel和他的同事基于表观基因组特征以及每个位点对于我们物种的存活有多么重要,在基因组内对位点进行聚类。然后对每个特征的结果得分进行聚合以创建“适合度结果图”或FitCons图。

如果自然选择在基因组中的某个位点上具有强大的影响力——尽管发生了突变和进化,但仍然保存了无数代——那么这部分基因组对于生存来说应该是重要的。此外,如果表观基因组分析可以鉴定出更多的保守位点,这会为我们提供大量的信息。

Siepel希望他的同事们能够参考FitCons来帮助确定哪些表观遗传标记或标记组合能够为下一步研究提供线索。他说:“我们试图通过将进化信息与我们已经知道的信息整合在一起来看看我们能学到什么。”

编译:小贝

审稿:西莫

责编:南熙