第四节 遗传信息和遗传密码
由mRNA把携带的遗传信息转化成特定的氨基酸顺序,这过程称为翻译(translation)。于是,复制、转录和翻译便构成了一整套信息传递过程。所谓基因表达就是遗传信息通过mRNA的传递而翻译成专一性的蛋白质或酶,从而使细胞的表型得以表现的过程(图3-31)。
一、遗传信息的流动
1958年Crick认为,信息流的传递方向只能由DNA→RNA→蛋白质,传递顺序是单向不逆转的,Crick把他的这一主张称为中心法则(central dogma)。到了1970年,D.Baltimore和H.Temin等发现了RNA病毒的反转录现象后,又相继在其他一些病毒中发现了单链RNA能够自我复制和转译。所以中心法则得到了修正,遗传信息流向可从DNA→RNA→蛋白质,也可以从RNA→DNA→RNA →蛋白质(图3-32)。总之,遗传信息是由核酸传向蛋白质,迄今为止还未发现有从蛋白质传向核酸的信息流。
二、遗传密码的破译
mRNA与蛋白质之间的信息传递是通过遗传密码(genetic code)来实现的。mRNA上每3个核苷酸顺序翻译成蛋白质多肽链上的一个氨基酸,称之密码子,也叫三联体密码。遗传密码是60年代阐明的。至于遗传密码的破译过程,大致经历了以下4个阶段:
1.以均聚物为模板指导多肽的合成
首先获得了大肠杆菌的无细胞蛋白质合成体系(ce11 free protein synthesis system)。这一体系是将大肠杆菌细胞破碎经过离心除去细胞碎片等所得的抽提物,含DNA、mRNA、tRNA核糖体AA -tRNA合成酶及其他酶类。此体系在预保温期间加入DNAase降解掉DNA,mRNA耗尽时,体系中的蛋白质合成即停止。当补充外源mRNA(或人工合成的各种均聚多核苷酸或共聚多核苷酸)、ATP、GTP、氨基酸等成分时,又能合成新的肽链,新生肽链的氨基酸顺序由外加的模板来决定。因此分析加入的模板和合成的肽链即可推知某些氨基酸的密码。
1961年,Nirenberg等在无细胞蛋白质合成体系中加入人工合成的多聚U,意外地发现新合成的多肽链中只含有苯丙氨酸,从而推出UUU代表苯丙氨酸(Phe)。随后以多聚C、A和G作模板加入到无细胞体系中,所合成的多肽中分别是多聚脯氨酸、多聚赖氨酸和多聚甘氨酸,这样很快解决了4种氨基酸的密码子(UUU→Phe, CCC→Pro, AAA→Lys, GGG→Gly)。
2.以随机均聚物指导多肽的合成
Nirenberg及Ochoa等又用各种随机的共聚核苷酸作为模板合成各种多肽。如以含有A、C两种共聚核苷酸作模板,任意排列时可出现8种三联体:即CCC、CCA、CAC、CAA、ACC、ACA、AAC、AAA,获得由Pro、His、Asn、Gln、Thr、Lys等6种氨基酸组成的多肽。依次类推,他们先后做了多种试验,主要有:以UA、UC、AG、CG、CG等组成的共聚物,分析模板和多肽的顺序,大致确定了某几种密码子决定哪几种氨基酸。
3.以特定顺序的共聚物为模板指导多肽的合成
(1)以固定多聚的二核苷酸作为模板可合成由2个氨基酸组成的多肽:如以多聚(UG)为模板合成的是多聚(Cys、Val),因为poly(UG)中含有Cys和Val的密码子。
5′ UGU GUG UGU GUG UGU ……3′
5′ GUG UGU GUG UGU GUG ……3′
这就看出,不论读码从U开始,还是从G开始,都只有UGU(Cys)和GUG(Val)两种密码子。
(2)以固定多聚三核苷酸作为模板可得到有3种氨基酸组成的多肽:如以poly(UUC)为模板,可能有3种起读方式:
5′ UUC UUC UUC UUC UUC …… 3′
5′ UCU UCU UCU UCU UCU …… 3′
5′ CUU CUU CUU CUU CUU …… 3′
根据读码起点不同,产生的密码子可能都是UUC(Phe),UCU(Ser),CUU(Leu),所以得到的多肽可能是poly(Phe)、poly(Ser)、poly(Leu)。由此可知,UUC、UCU、CUU分别是苯丙氨酸、丝氨酸和亮氨酸的密码子。当然,以多聚三核苷酸为模板时也可能只合成2种均聚多肽,如poIy(GUA)。
5′ GUA GUA GUA GUA GUA …… 3′
5′ UAG UAG UAG UAG UAG …… 3′
5′ AGU AGU AGU AGU AGU …… 3′
由第2种读码方式产生的密码子是终止密码,没有对应的氨基酸与之结合,不能合成多肽,因此只产生2种有意义的密码子GUA(Val)或AGU(Ser),那么所合成的多肽则是poly(Val)或poly(Ser)。
4.核糖体结合技术
Nirenberg及Leder改用核糖体结合技术来解决密码问题(图3-33)。这个方法是以人工合成的三核苷酸如UUU、UCU、UGU ……等为模板,在含有核糖体、AA-tRNA以及适当离子强度的反应液中保温。然后,让反应液通过硝酸纤维素滤膜。这时游离的AA-tRNA因分子小可以透过滤膜。三核苷酸模板可与对应的AA-tRNA结合,并附着在核糖体上,而且核糖体不能透过滤膜。这样即可把已与三联体核苷酸结合或未结合的AA-tRNA分开。
若用20种AA-tRNA作同样的实验,共20组,每组都含有20种AA-tRNA和某种三核苷酸,但只有一种氨基酸用14C标记,看哪一种氨基酸-tRNA留在滤膜上,并分析这一组的模板是什么三核苷酸,从模板三核苷酸与氨基酸的关系可测知该氨基酸的密码子。如模板是UUU时,Phe-tRNA结合于核糖体上,可知UUU是Phe的密码子。通过上述方法终于测定出了20种氨基酸的密码子,表3-12是通用的遗传密码字典。
三、遗传密码表的使用
按照一个密码子由3个核苷酸组成的原则,4种核苷酸可组成64种密码子,现在知道其中61种是氨基酸的密码子,即有意义密码,另外3个是UAA、UAG和UGA并不代表任何氨基酸,它们是终止密码,不能与tRNA的反密码子配对,但能被终止因子或释放因子识别,终止肽链的合成。其中UAA叫赭石(Ochre)密码,UAG叫琥珀(Amber)密码,UGA叫乳石(Opal)密码。
四、遗传密码的特性
1.兼并(degeneracy)性
在64种密码子中有61种是有意义的密码,它们决定了20种氨基酸,因而许多氨基酸有多个密码子,实际上在20种氨基酸中只有2种氨基酸(甲硫氨酸,AUG和色氨酸,UGG)分别只有一个密码子外,其他氨基酸都有一个以上密码子,其中9种氨基酸有2种密码子,
表 3-12 20种氨基酸的遗传密码子
第一碱基5′-OH |
第二碱基 |
第三碱基 |
|||||||
U |
C |
A |
G |
||||||
U |
UUU |
苯丙氨酸 phe |
UCU |
丝氨酸ser |
UAU |
酪氨酸tyr |
UGU |
半胱氨酸cys |
U |
UUC |
UCC |
UAC |
UGC |
C |
|||||
UUA |
亮氨酸leu |
UCA |
UAA |
终止信号 |
UGA |
终止信号 |
A |
||
UUG |
UCG |
UAG |
UGG |
色氨酸trp |
G |
||||
C |
CUU |
亮氨酸leu |
CCU |
脯氨酸pro |
CAU |
组氨酸his |
CGU |
精氨酸arg |
U |
CUC |
CCC |
CAC |
CGC |
C |
|||||
CUA |
CCA |
CAA |
谷氨酰胺gln |
CGA |
A |
||||
CUG |
CCG |
CAG |
CGG |
G |
|||||
A |
AUU |
异亮氨酸ile |
ACU |
苏氨酸thr |
AAU |
天冬酰胺asn |
AGU |
丝氨酸ser |
U |
AUC |
ACC |
AAC |
AGC |
C |
|||||
AUA |
ACA |
AAA |
赖氨酸lys |
AGA |
精氨酸arg |
A |
|||
AUG |
甲硫氨酸met 起始信号 |
ACG |
AAG |
AGG |
G |
||||
G |
GUU |
缬氨酸val |
GCU |
丙氨酸ala |
GAU |
天冬氨酸asp |
GGU |
甘氨酸gly |
U |
GUC |
GCC |
GAC |
GGC |
C |
|||||
GUA |
GCA |
GAA |
谷氨酸glu |
GGA |
A |
||||
GUG |
兼做起始信号 |
GCG |
GAG |
GGG |
G |
1种氨基酸有3个密码子,5种氨基酸有4个密码子,3种氨基酸有6个密码子。氨基酸有一种以上密码子所决定的现象称为兼并。对应于同一氨基酸的不同的密码子叫同义密码子(synonym codons)。另外,AUG和GUG既是甲硫氨酸、缬氨酸的密码,又是起始密码子。
同义密码一般不随机分布,而是第1、第2碱基大多相同,而第3碱基的改变并不影响对应的氨基酸。这相应提高了物种稳定性,减少了碱基改变而引起的变异。
2.通用性
遗传密码不论在体内还是在体外,包括病毒、细菌、动植物的绝大多数生物都是通用的。如多聚U在病毒、细菌以至哺乳动物体内都能促进苯丙氨酸的合成。
但也有例外,1980年对人、牛及酵母线粒体DNA顺序及DNA结构的研究发现,最少在线粒体中有以下例外情况:
(1)密码子AUA编码Met,而不是编码Ile,使Ile的密码子从原来的3个变为2个,而Met的密码子由1个增至2个。
(2)密码子UGA不是终止密码,而是Trp的密码,因而Trp密码子有2个。
(3)密码子AGA、AGG不是Arg的密码,而是终止密码子,因而在哺乳动物线粒体中有4个终止密码。
(4)除密码子AUG外,AUA、AUU也可作为起始密码子。
3.摆动性
在蛋白质生物合成过程中,tRNA的反密码子在核糖体内是通过碱基的反向配对与mRNA上的密码子相互作用的,如甲硫氨酸的密码子是5′ AUG3′,反密码子是3′ UAC 5′。但由于密码子的兼并性,第一,第二碱基非常重要,而第三碱基相对可发生变动,即摆动。
l966年Crick根据实验提出摆动假说(wobble hypothesis)以解释反密码子中某些稀有碱基成分(如次黄嘌呤)的配对及许多氨基酸具有简并现象的问题。摆动假说的内容是:在密码子和反密码子的配对中,前两对碱基严格遵守碱基配对法则,第3对碱基可以较自由的“摆动”,因而使某些tRNA可以识别一个以上的密码子。究竟能识别多少个密码子是由反密码子的第一位碱基的性质来决定(表3-13)。
表3-13 密码子第三碱基和反密码子第一碱基的配对
反密码子中的第一碱基(5′ 端) 密码子中的第3碱基(3′ 端)
A U
C G
G A或G
G U或C
I U、C或A
4.起始性和终止性
在原核生物中大部分以AUG为起始密码子,少数使用GUG。真核生物则全部使用AUG为起始密码。终止密码子UAA、UAG、UGA全部被使用,有时连用两个终止密码子,以便更保险地终止肽链合成。
5.不重叠性
一条mRNA分子中相连的3个核苷酸(三联体)编码一个氨基酸,而不能与相邻的三联体重叠编码多个氨基酸。试验证明核酸分子中一个核苷酸转变为其他核苷酸,只能影响多肽链中的一个氨基酸,而不是多个氨基酸发生变化。
6.连续性
多肽链合成时有终止信号,但在一个结构基因内却无终止信号,也就是说,在一条mRNA分子内无终止密码子,只合成一条多肽链。当然,若一个结构基因内有终止信号时,合成的多肽链就往往是断片或无功能的。