生命的秘密(三):自我复制

编者按:

所有长青的生命都必须想出一个办法让自己适应沧海桑田的环境变化,抵抗生命谱系的衰退和灭亡。对于地球生命而言,不断的自我复制是适应变化抵挡衰亡的不二法门。现代科学告诉我们DNA和蛋白质对于生命的自我复制缺一不可,那么地球最初的生命又是如何开启自我复制的呢?

撰文 | 王立铭(浙江大学生命科学研究院教授)

责编 | 徐可

● ● ●

在上一篇文章里我们讲到了能量,讲到了原始地球的海洋里出现了构造生命的砖块,也讲到了化学渗透理论启动了生命大厦的建筑师。

但是仅仅有能量是不够的。

能量的持续注入确实可以构建出充满秩序的生命大厦,尽管辉煌美丽,但却有一个致命的问题——非常畏惧变化、非常脆弱。

我们可以想象,哪怕是一点微小的变化,比如第29层的大梁短了一毫米,东南角地基的混凝土粘度高了百分之一——理论上都可能威胁到一座摩天大楼的安全。生命大厦的历史越久远,这些微小变化就越能够不断累积,直至让大厦千疮百孔,直至走向坍塌、衰退和死亡。而反过来,如果大厦坚固强硬到一丝不动呢?也不行,因为地球本身是在变化的!如果生命永远一成不变,那么慢慢累积的环境改变也必然会杀死生命,世界上没有能适应所有环境的超级生命存在。

因此那些能够绵延不休枝繁叶茂的地球生命,都必须想出一个办法增强自己抵抗衰退和死亡的能力。

地球生命的解决方案就是今天故事的主角:自我复制。也就是说,面对随时可能出故障的自我,面对难以捉摸的环境,不停地制造更多的自己。

01

最简单的生命什么样?

至少从逻辑上看,不断的自我复制确实是对抗自身衰退和环境变迁的法宝。一方面,自我复制可以为生命留下多个拷贝,这样就算某些生命个体因为致命的意外而死亡,它至少还有许多个“自己”活在世上。另一方面,不断的自我复制过程中会出现难以避免的微小错误和变化,这些错误反而让生命具备了适应地球环境变化的可塑性。

而至少在地球的自然史上,自我复制正是生命的标志之一。人类男女结合繁衍后代,鲜花靠蜜蜂把花粉传播四方,肉眼看不见的细菌也可以一分为二二分为四的分裂产生更多的自己。就连活在生命定义边缘的病毒,一旦进入宿主的细胞中也会疯狂复制自己。

这里,我们不妨构造一个极端简化的生命来探讨一下生命自我复制的原理。

我们首先假想的生命(就叫它生命1.0吧)只有一个元件。首先是一个特别的蛋白质分子——我们刚刚故事里讲过的、为生命制造能量的ATP酶。通过我们之前的讨论大家已经看到的,如果地球生命真的可以简化到只有一个蛋白质,那么ATP酶入选的概率几乎是100%。这个古老的蛋白质大约由五百多个氨基酸分子构成,能蜷曲折叠成一个复杂的、带有三个叶片和一个管道的三维结构,通过飞速的旋转不停地生产能量。

但是生命1.0是难以自我复制的。从上一篇故事里大家已经知道,ATP酶有一个极端精巧和复杂的三维立体结构,每个维度上原子排列的精确度达到零点几个纳米的水平。漫说想要一丝不错地复制一个这样的结构非常困难,即便是想要看得清楚一点都不容易。难以自我复制的生命1.0注定要孤独一生——而且它的一生一定非常短暂。

为了解决自我复制的技术困难,我们想出一个办法是把三维的空间信息转化成一维的线性信息。比如说,我们可以给生命1.0稍作升级为2.0版,加入一条长长的脱氧核糖核酸(DNA)链条。这条长链上按照某种古老的密码,忠实的记录了构成ATP酶每一个氨基酸的信息。每次生命2.0需要自我复制的时候,只需要依样画葫芦的抄写一遍DNA链就行了——因为DNA密码本上记录的信息可以指导制造更多的ATP酶——而与此同时复制一条DNA链要比直接复制ATP酶的三维结构省心省力得多。

在上世纪五十年代,詹姆斯.沃森(James Watson)和弗朗西斯.克里克(Francis Crick)通过利用来自罗莎琳.富兰克林(Rosalind Franklin)获得的DNA的X射线衍射图谱,建立了DNA的双螺旋模型,并几乎是立刻猜测到了DNA是如何自我复制的。简单来说,就像蛋白质是由20种氨基酸砖块组合而成的,DNA也有它独有的砖块:四种不同的核苷酸分子(可以简单的用A/T/G/C四个字母指代)。每条DNA链条都是由这四种砖块首尾相连组成的。特别重要的是,ATGC四种分子能够两两配对形成紧密的连接,A和T,G和C。因此可以马上想像,一条顺序为AATG的DNA可以和一条CATT的DNA首尾相对的配对组合缠绕在一起。这样的配对方法特别适合DNA密码的自我复制:AATG和CATT两条缠绕在一起的链条首先分离开来,两条单链再根据配对原则安装上全新的核苷酸分子,例如AATG对应上CATT,而CATT则装配了AATG,由此一个DNA双螺旋就变成了完全一样的两个DNA双螺旋。DNA的复制过程异常精确,复制出错的概率仅有10的九次方分之一。(图片来自英文维基百科)

那么简单而强大的生命2.0是不是要雄霸地球生物圈了呢?不行,事实上这样的生命根本就不可能存在!DNA是一种化学上非常稳定的分子,在自然条件下一根光秃秃的DNA链条根本就什么都不会发生,既不可能自我复制也不可能制造出ATP酶来。就像一本写满了字母的密码本要是没有人抄写没有人解读它自己什么也做不了。

好吧,不气馁的我们继续升级出生命3.0。这次,我们需要蛋白质种类就多了许多,除了负责生产能量的ATP酶之外,至少还有一大堆负责DNA复制的蛋白质帮手——有负责把高度折叠的DNA展开变成长线,有的负责在长线上定位到底从哪里开始复制,有的负责运送复制所需的原材料,有的负责填补复制当中的缺口。同时还需要一大堆蛋白质帮手根据DNA密码本的信息制造ATP酶——有的负责读取DNA密码本的信息,有的负责搬运蛋白质的原料氨基酸,有的负责氨基酸的装配顺序等等。相应的,DNA密码本的厚度也就要多出好多倍,不光要记录ATP酶的制造密码,还需要记录那些蛋白质帮手们的制造密码。生命3.0的命运如何?

还差一点点。

根据我们上面的描述大家就能猜想到,蛋白质和DNA密码本对于生命的生存和复制来说,是需要紧密合作缺一不可的。因此因此我们必须想出一个办法,把这些东西统统聚拢到一起、保护起来。否则蛋白质也好DNA也好,很容易在危险的自然环境中扩散的无踪无影谁也找不到谁。那我们必须用一张致密的网把所有这些林林总总的蛋白质和DNA都给包裹起来——这次就叫生命4.0吧。

嗯,这下确实有点极简版地球生命样子了!我们权且相信我们制造的生命4.0能够在地球上生存下来,因为它能够不断地从环境中攫取能量供自身消耗,也能不停地自我复制对抗衰退和死亡。但是问题是,生命4.0真的有可能在四十亿年前魔法般的自发出现么?换句话说,生命4.0的构想,有可能真的模拟了地球生命的起源么?

02

鸡生蛋还是蛋生鸡?

很遗憾,答案是不可能。

这类似鸡生蛋还是蛋生鸡的问题。我们已经看到,蛋白质的全部信息都储存在DNA密码本之中,DNA密码本指导了蛋白质的制造。因此让我们权且假定DNA是“鸡”,蛋白质是它下的“蛋”。但是同时我们也已经知道,一条孤零零的DNA是没有办法干任何事情的,它依赖各种蛋白质的帮忙才能实现自我复制,同样也要依赖蛋白质的帮忙才能制造出蛋白质。没有蛋白质“蛋”提前准备好,DNA“鸡”根本没法继续生“蛋”!

换句话说,我们设计的生命4.0想要自发出现在原始地球的海洋里,唯一的可能就是大自然同时造就了互相匹配的“鸡”和“蛋”。而且“鸡”和“蛋”还必须几乎同时出现、距离无比接近、才有可能配合起来造就生命。要是一阵电闪雷鸣中一只DNA鸡被创造了出来,但是没有等到那只冥冥中注定的蛋,这只DNA鸡只能沉默着走向分解破碎,因为它自己什么也做不了。而反过来,要是那个蛋白质蛋率先在海底的热泉口奇迹现身,因为没有DNA帮它保留和传递密码,这只蛋就算能勉强生存和工作几下,也必然会在不断地错误积累中走向衰退和死亡。而你如果期待鸡和蛋同时降临凡间,而且这只石头缝里蹦出来的DNA鸡正好就忠实的记录了那个蛋白质蛋的所有信息,你可能必须相信冥冥中有天意在眷顾地球生命了!

那怎么办?生物学对此的回答是非常耐人寻味的:既不是先有蛋,也不是先有鸡。事实上,很可能生命出现的时候,鸡和蛋都还没有踪影呢。

让我们再回顾一下生命4.0的基本设计原则吧。DNA负责记录蛋白质的制造密码,蛋白质负责维持生命活动和帮助DNA复制自身。好像是个挺简单的系统是不是?在自然界,简单往往意味着高效、意味着节约、意味着更容易自发出现。但是很让人意外的是,今天的地球生命看起来不约而同选择了更复杂、相对也就更容易出错和更浪费的办法。它们当中的绝大多数都不是DNA+蛋白质的二元化结构,中间平白无故的多了一个东西:核糖核酸(RNA)。


依据中心法则,DNA的自我复制保证了遗传信息的传递和生命的生生不息,DNA也通过指导蛋白质合成决定了生命活动的形态。RNA的产生则是其中的一个中间步骤,一方面RNA忠实抄写了DNA的密码信息,一方面RNA直接指导了蛋白质的制造。值得指出的是,地球生命中也有不少自外于中心法则的生命。比如某些病毒并没有DNA,直接利用RNA来存储遗传信息并指导蛋白质合成(例如流感和丙肝病毒)。也有一些病毒虽然使用DNA,但是和前图中不同,它们仅有一条单链DNA,只是在启动自我复制的时候才变成双螺旋。(图片来自biology.tutorvista.com)

RNA是一种长相酷似DNA的化学物质,两者的唯一区别就是化学骨架上的一个氧原子。对于我们的生命4.0系统来说,RNA感觉像二郎神的第三只眼睛一样怪异多余。当生命开始活动的时候,DNA密码本的信息首先忠实的誊抄到RNA密码本上,然后RNA再去指导蛋白质的装配。加上RNA的生命,姑且就叫他生命5.0好了,实在是看不出有什么优势来。打个比方,原本在车间里,一个经理直接指导工人干活就挺好的,命令传达简单快捷还不容易出错。现在非要给经理配一个主管,每一道命令都必须由经理告诉主管,主管再告诉工人。直觉告诉我们这样的系统一定更存在命令走样变形,人际关系复杂多变的问题,更不要说还得多付这个主管的工资了!

然而这套所谓的“中心法则”几乎成了所有地球生命的中心。这种巨大的反差驱使人们从反方向思考,也许DNA-->RNA-->蛋白质的系统有极其深远但仍不为人所知的意义,以至于尽管看起来如此多余、低效和浪费的系统能够挺过严酷多变的地球环境以及物种竞争,保留在绝大多数地球生命的身体里。

事实上,早在上个世纪中叶,中心法则刚刚被提出的时候就已经开始有人问这样的问题了。例如1968年,DNA双螺旋的发现者之一克里克就在一篇文章中大胆的猜测也许看起来多余的RNA才是最早的生命形态。他甚至说,“我们也不是不能想象,原始生命中根本没有蛋白质、而是完全由RNA组成的”。但是猜想毕竟只是猜想,看似无用的RNA反而可能是最早的生命,重要的DNA鸡和蛋白质蛋反而仅仅是RNA的后代和附属品——这样的想法可以引发很多哲学上有趣的思考,但是很少有人期待真的在自然界或者实验室里验证它。

03

核酶:RNA的两副面孔

1978年,30岁的生物化学家汤姆·切赫(Tom Cech)来到美丽的山城、美国科罗拉多州的邦德建立了自己的实验室。他的研究兴趣和我们讲到过的中心法则很有关系。

我们已经知道,RNA是一种连接了DNA和蛋白质之间的分子。它誊抄了DNA密码本的信息,然后再开工制造蛋白质。不过早在1960年代人们就已经发现,RNA密码本其实倒并不是一字不差誊抄了DNA密码本的信息。例如DNA密码本中往往会写着大段大段看起来没有什么特别用处的“废物”字母(它们的学名叫做“内含子”)。在抄写RNA密码本的时候,生物会首先老老实实地誊抄这些废物字母,之后再将他们整页撕去,整理出更精简更经济的一本密码本。

切赫当时的兴趣就是研究这种被叫做“RNA剪接”——也就是如何撕去密码本中间多余的纸张——的现象。他使用的研究对象是嗜热四膜虫,一种分布广泛的淡水单细胞生物。嗜热四膜虫是一种很经典的模式生物,很容易大量培养,它个头很大(直径有30-50微米),也很方便进行各种显微操作。而研究RNA剪接也是分子生物学黄金年代里炙手可热的话题之一,毕竟它关系到遗传信息如何最终决定了生物体五花八门的生物活动和性状。


这种看起来不起眼的单细胞生物孕育了上世纪许多伟大发现。除了下文讲到的核酶和RNA世界,还有对于衰老异常重要的端粒和端粒酶(2009年诺贝尔奖),以及蛋白质的翻译后修饰等。(图片来自www.nationalgeographics.com)

切赫一开始的目标是很明确的。他从一开始就已经知道,四膜虫体内的RNA分子中段,有一截序列是没有什么用的。这段被成为“中间序列”的无用信息,在RNA刚刚被制造出来之后就很快会被从中间剪切掉。就像是RNA密码本自动撕去了写满废话的一张。而这个过程是怎么发生的呢?切赫希望利用四膜虫这个非常简单的系统来好好研究研究。他的猜测也很自然:肯定有那么一种未知的蛋白质,能够准确的识别这段RNA中间序列的两端,然后咔嚓一刀切断RNA长链,再把两头缝合起来,RNA剪接就此完工。

为了找出这个未知的蛋白,切赫的实验室使用了最经典的化学纯化方法。他们先制备出尚未被切割的完整RNA分子,再加入从四膜虫细胞提取出来的蛋白质混合物,RNA分子应该会被剪接。之后他们的计划是,一步步把蛋白质混合物分离、提纯、排除掉那些对RNA剪接没有影响的蛋白质,最终留下的应该就是他们要找的那个负责剪接RNA的蛋白质了。

但是他的尝试几乎立刻就撞墙了。切赫发现,RNA分子加上四膜虫蛋白“汤”,确实会被很顺利的剪接。但是就在同一个实验里,他们发现即便什么蛋白质都不加,RNA分子也同样出现了剪接!

任何一个受过起码科学训练的人都明白,这个现象有多令人沮丧。什么都不加的RNA分子也能被剪接,看起来只有两个可能性:第一,切赫他们制备的RNA已经被污染了,里面混进去了能够切割RNA的蛋白,因此不管再加不加东西RNA分子都被剪接了。第二,切赫他们看到的这个现象压根就不是RNA剪接,而是一种不知道什么的实验错误,因此加不加其他蛋白质他们看到的都不是剪接。不管是哪种解释,眼看着这个实验就做不下去了。

于是切赫他们尝试了各种各样的办法来改进实验。他们首先假定自己的纯化功夫确实不到位,RNA被污染了,因此想要从里面找出那种被“污染”的蛋白是什么,没成功;他们也往纯化出的RNA分子里加上各种各样破坏蛋白质活性的物质,试图停止RNA的剪接,发现也不成功;他们甚至还做了更精细的化学实验来研究RNA到底是怎么被剪接的、发生了什么化学修饰……

终于到了1982年,他们拿到了“惊人”的决定性证据。他们干脆放弃了对RNA分子各种徒劳的提纯,直接在试管里合成了一条RNA。然后他们终于可以明白无误的确认,这条干净的RNA在什么外来蛋白质都没有的条件下,仍然固执的实现了自我剪接,把那段没用的中间序列给切割了出来!事情已经无可置疑,根本不存在那种看不见摸不着又总是顽固剪接RNA的蛋白质,RNA可以自己操起家伙来剪断和粘合自己!

说得更酷一点,原本大家都觉得多余和浪费的RNA分子,居然可以身兼DNA和蛋白质的双重功能:它显然可以和DNA一样储存信息,它同时也可以像蛋白质一样催化复杂的生物化学反应——在切赫的例子里就是剪接自身。切赫给他们找到的这种新物质命名为“核酶”(ribozyme,兼具核酸和酶的功能之意),仅仅七年之后,切赫就凭此发现获得了诺贝尔化学奖。


核酶的最终证明。1982年,切赫和同事们发现,完全人工合成的RNA分子,也可以实现自我切割和连接,抛弃掉一段约400个碱基长度的无用序列(上图中标记为“IVS”的RNA条带)。由此证明,RNA在没有蛋白质的情况下也可以单独催化生物化学反应。(图片来自Kruger et al Cell 1982)

04

世界属于RNA

核酶的概念立刻被用来理解生命起源:不是说DNA和蛋白质先有鸡还是先有蛋无法解决么?核酶这种奇怪的东西,至少理论上可以既是鸡又是蛋!只要想象一个这样的RNA分子——它自身携带遗传信息,同时又能催化自身的复制——那不就可以实现遗传信息的自我复制和万代永续了么?什么DNA,什么蛋白质,对于伟大的生命起源来说不过是事后锦上添花的点缀而已!

不得不承认,这个思路的脑洞还是开的很大的。要知道,切赫发现的核酶虽说确实实现了一点蛋白质的功能,但这个功能还是极其简单的:给RNA做个砍头接脚的外科手术而已。而如果真要设想一种核酶能够实现自我复制的功能,它必须能够以自身为模版,从头到尾一个一个核苷酸精确组装起来,这个难度比起RNA剪接,简直是汽车流水线和榔头剪刀的差别。更重要的是,嗜热四膜虫毕竟只是一种高度特化的小生物,凭什么认为核酶这种东西真的有普遍意义,真的会代表了生命诞生的初始状态?

但就在这个大胆的思路指引下,全世界展开了发现、改造和设计核酶的竞赛。越来越多的核酶分子,越来越多存在核酶的物种都被发现了。到了2001年,美国麻省理工学院的科学家们成功“制造”出了一种叫做R18的、具有部分自我复制功能的核酶分子,第一次证明核酶确实不光能当榔头剪刀,还真的可以装配汽车!当然,R18的功能还远不能和我们40亿年前的那个共同祖先相比——R18仅仅能够复制自身不到10%的序列,也就意味着R18这样的“生命”一代之后就会衰退死亡,而我们的祖先可定需要100%复制自身的能力。但这毕竟是一个概念上的巨大突破。要知道,既然人类科学家都可以在短短几年内设计出一个具备初步复制能力的核酶,没有理由怀疑无比浩瀚的地球原始海洋在几亿年的时间里不能孕育出一个真正的祖先核酶。


人工设计核酶的进展惊人。R18能够复制长度为自身7%的序列,而最新的tC9Y核酶可以复制超过合成长度的RNA序列,至少在理论上tC9Y就已经具备了自我复制的能力。图片来自Lehman 2013 Nature Chemistry

就在这一系列激动人心的科学发现中,克里克1968年的假说重新被人们翻了出来,而到了1986年,另一位诺贝尔奖得主、哈佛大学的沃特·吉尔伯特(Walter Gilbert)更是正式竖起了“RNA世界”的大旗,要替RNA抢回地球生命的发明权了。这可能是最接近真相、也最能帮助我们理解生命起源的理论了。这个理论的核心就是,RNA作为一种既能够存储遗传信息、又可以实现催化功能的生物大分子,是地球生物的共同祖先。可能在亿万年前的海洋里,不知道是由于高达数百度的深海水温、还是刺破长空的闪电、还是海底火山喷发出的高浓度化学物质,数不清的RNA分子就这样被没有缘由地生产出来、飘散、分解。直到有一天,在这无数的RNA分子、也就是无穷无尽的碱基序列组合中,有这样一种组合(例如R18)恰好产生了能够自我复制的催化能力。于是她苏醒了,活动了,无数的“后代”被制造出来。

今天的生命世界(左)和RNA世界(右)。今天绝大多数的地球生命都在中心法则的支配下生存繁衍,DNA储存遗传信息并持续的自我复制,DNA通过RNA控制了蛋白质的合成和生物体的性状。在这个模型中,RNA仅仅作为信息流动的中间载体出现,看起来多余而浪费。但是在远古地球、甚至是生命刚诞生的时候,情形可能会很不同。赞成RNA世界理论的科学家们认为,在那个时候也许既没有DNA也没有蛋白质,而是RNA分子身兼两职,又能代替DNA储存遗传信息、又能代替蛋白质推动各种生物化学反应。(图片来自rsc.org)

自我复制的RNA先祖,并不需要按照我们刚刚假设的生命1.0到5.0的固有轨迹发展变化。事实上,RNA先祖只需要结合最简单的生命1.0版,也就是自我复制能力加上能量制造的能力,辉煌的生命大厦就可以拔地而起了。能量帮助地球生命摆脱热力学的诅咒,在混乱无序的自然界中建立起精致有序的生命结构;而RNA先祖则肩负起自我复制、为生命开枝散叶的重任。此后四十亿年的漫漫进化,出现DNA和蛋白质、多细胞生物诞生、人类萌生、智慧出现,其实都只是那一次伟大结合的绵绵余韵而已!

敬请期待下文,生命的秘密(四):感觉:与客观世界握手


本文与王立铭的个人微信公众号“以负墒为生”(Neg_Entropy)同步推送。

知识分子,为更好的智趣生活。

关注请加微信号:the-intellectual。投稿、授权事宜请联系