第三节 DNA转录和RNA的种类
一、DNA的转录
所谓转录(transcription)是指以一条DNA单链为模板合成RNA,同时把遗传信息从DNA传递到RNA的过程(图3-19)。下面归纳出DNA转录的要点:
1.转录的非对称性
DNA转录时,在RNA聚合酶的作用下细胞核中DNA分子的双链某区段局部分开,成为2个单链区段。其中一条参与DNA转录的单链称为信息链(sense strand);另一链不进行转录,则为非信息链或反意链(antisense strand)。也就是说,在RNA聚合酶的作用下,DNA分子中的信息链作为合成RNA的模板,按照碱基互补的原则聚合4种核糖核苷酸,经氢键配对,合成出一条RNA分子。
但要强调:这种转录的不对称性只是指某一基因而言,并不是指整条DNA分子。实际上,在完整的DNA分子中,若把两条链分别命名为A和A′,则某一基因可依A链为模板进行转录,另一基因可依A′ 链为模板,即两链在不同的区段都有转录的可能性。现已知道,只有极少数生物,如双链DNA病毒的两条链都可作模板,合成两条完全不同的RNA分子。
2.转录的过程是RNA聚合酶(RNA polymerase)聚合4种碱基的过程
在RNA聚合酶的作用下,依赖DNA的信息链为模板,按A与U配对、G与C配对的原则,把A、U、C、G 4种核糖核苷三磷酸聚集起来,以磷酸二酯键相连,形成单链RNA,它们再经折叠或与蛋白质相结合,成为特定功能的RNA;也有的可直接行使功能,如mRNA。
3.需转录机器——RNA聚合酶和多种辅助因子
(1)原核生物的RNA聚合酶:大多数原核生物RNA聚合酶的组成是相同的,大肠杆菌RNA聚合酶由2个α亚基、一个β亚基、一个β′亚基和一个ω亚基组成,称为核心酶。加上一个σ亚基后则成为聚合酶的全酶(holoenzyme),相对分子质量为4.65×105d。
现已知β和β′ 亚基组成了聚合酶的催化中心,β亚基能与模板DNA、新生RNA链及核苷酸底物相结合(表3-7)。
表3-7 大肠杆菌RNA聚合酶的组成分析
亚基 基 因 相对分子质量 亚基数 组 分 功 能
α rpoA 3.65×104 2 核心酶 核心酶组装,启动子识别
β rpoB 1.51×105 1 核心酶 β和β′共同形成RNA合成的活性中心
β′ rpoC 1.55×105 1 核心酶
ω ? 11×104 1 核心酶 未知
σ rpoD 7.0×104 1 σ因子 存在多种σ因子,用于识别不同的启动子
在RNA聚合酶中,σ因子非常重要,它是负责模板链的选择和转录的起始,是酶的别构效应物,使酶专一性识别模板上的启动子。而且,在某些细胞内能识别不同启动子的σ因子,以适应不同生长发育阶段的要求,调控不同基因转录的起始。另外,σ因子对启动子的结构基本是固定的(表3-8)。
表 3-8 大肠杆菌中的σ因子能识别并与启动子区的特异性序列相结合
因子 基因 功能 -35区 间隔 -10区
σ70 rpoD 广泛 TTGACA 16~18bp TATAAT
σ32 rpoH 热体克 TCTCNCCCTTGAA 13~15bp CCCCATCTA
σ54 rpoN 氮代谢 CTGGNA 6bp TTGCA
(2)真核生物的RNA聚合酶:真核生物中共有3类RNA聚合酶,其结构比大肠杆菌RNA聚合酶更复杂,它们在细胞核中的位置不同,负责转录的基因不同(表3-9)。真核生物RNA聚合酶一般有8~14个亚基所组成,相对分子质量超过5×105d。
表3-9 真核细胞中3类RNA聚合酶特性比较
酶 细胞内定位 转录产物 相对活性对
RNA聚合酶I 核仁 rRNA 50%~70%
RNA聚合酶Ⅱ 核质 hnRNA 20%~40%
RNA聚合酶Ⅲ 核质 tRNA 约10%
(3)线粒体和叶绿体RNA聚合酶:真核生物线粒体和叶绿体中还存在着不同的RNA聚合酶。线粒体RNA聚合酶只有一条多肽链,相对分子质量小于7×104d,是已知最小的RNA聚合酶之一。叶绿体RNA聚合酶比较大,结构上与细胞核中的聚合酶相似,由多个亚基组成,部分亚基由叶绿体基因组编码。
(4)真核生物转录辅助因子:在真核生物DNA转录时,除了需RNA聚合酶外,在转录起始过程中至少需要7种辅助因子(表3-10)。因为不少辅助因子本身包含多个亚基,所以转录起始复合物的结构非常大。
表3-10 真核生物RNA聚合酶Ⅱ所形成的转录起始复合物的组成
蛋白质 |
亚基数 |
亚基的相对分子质量/103d |
功 能 |
RNApolⅡ TBP TFⅡA TFⅡB TFⅡD TFⅡE TFⅡ F TFⅡH |
12 1 3 1 12 2 2 12 |
10~220 38 12,19,35 35 15~250 34,57 30,74 35~89 |
催化RNA的生物合成 与启动子上的TATA区相结合 使TBP及TFⅡB与启动子的结合比较稳定 与TBP相结合,吸引RNA聚合酶和TFⅡF到启动区上 与各种调控因子相互作用 吸引TFⅡH,有ATP酶及解链酶活性 结合RNA聚合酶Ⅱ并在TFⅡB帮助下阻止聚合酶与非特异性DNA序列相结合 在启动子区解开DNA双链,使RNA聚合酶Ⅱ磷酸化,接纳核苷酸切除修复体系 |
4.转录的起始非常严格
(1)启动子(promotor)的选择:启动子是指在DNA转录时,RNA聚合酶首先识别并结合的区域,然后开始转录。选择的具体过程包括RNA聚合酶对启动子的识别,聚合酶与启动子可逆性结合形成封闭复合物(closed complex)。此时,DNA链仍处于双链状态。伴随着DNA构象上的重大变化,封闭复合物转变成开放复合物(open complex),RNA聚合酶所结合的DNA序列中有一小段双链被解开(图3-21)。对于强启动子来说,从封闭复合物到开放复合物的转变是不可逆的,是快反应。开放复合物与最初的两个NTP相结合并在这两个核苷酸之间形成磷酸二酯键后,转变成包括RNA聚合酶、DNA和新生RNA的三元复合物。
(2)启动子的基本结构:启动子是一段位于结构基因5′ 端上游区的一段DNA序列,能活化RNA聚合酶,使之与模板DNA准确结合并具有转录起始的特异性。因为基因的特异性转录取决于RNA聚合酶与启动子能否有效地形成二元复合物,所以,RNA聚合酶如何有效地找到启动子并与之相结合是转录起始过程中首先要解决的问题。
转录的起始是基因表达的关键阶段,启动子的结构影响了它与RNA聚合酶的亲和力,从而影响了基因表达的水平。转录单元(transcription unit)是一段从启动子开始至终止子(terminator)结束的DNA序列。RNA聚合酶从转录起点开始沿着模板前进,直到终止子为止,转录出一条RNA链。在细菌中,一个转录单元可以是一个基因,也可以是几个基因。常把起点前面即5′ 末端的序列称为上游(upstream),而把其后面即3′ 末端的序列称为下游(downstream)。在描述碱基的位置时,一般用数字表示,起点为 1,下游方向依次为 2、 3……,上游方向依次为–1、–2、–3……。
启动子区是RNA聚合酶的结合区,其结构直接关系到转录的效率(图3-20)。对大肠杆菌、T7噬菌体等多种病毒的启动子结构进行了序列分析发现:在前端有一个由5个核苷酸组成的共同的序列,是RNA聚合酶的紧密结合点,称为Pribnow区(Pribnow box),该区的中央大约位于起点上游10bp处,所以又称为-10区,或TATA区。在此区外的-35bp附近有一段共同序列为TTGACA,常称为GACA区。TATA区和 -35位的TTGACA区是RNA聚合酶与启动子的结合位点,能与σ因子相互识别而具有很高的亲和力:
-35区 -10区
……T85T83G81A61C69A52……T89A89T50A65A100……
在真核生物基因中,Hogness等先在珠蛋白基因中发现了类似Pribnow区的Hogness区(Hogness box),这是位于转录起始点上游-25~-30bp处的共同序列TATAAA,也称为TATA区。另外,在起始位点上游-70bp~-78bp处还有另一段共同序列CCAAT,这是与原核生物中-35bp 区相对应的序列,称为CAAT区(CAAT box)。
5.转录时存在增强子
除了启动子以外,近年来发现另一序列与转录的起始有关。在SV40的转录单元上发现它的转录起始位点上游约200bp处有两段72bp长的重复序列,它们不是启动子的一部分,但能增强或促进转录的起始,除去这两段序列会大大降低这些基因的转录水平,若保留其中一段或将之取出插至DNA分子的任何部位,就能保持基因的正常转录。因此,称这种能强化转录起始的序列为增强子或强化子(enhancer)。
把β-珠蛋白基因置于带有上述72bp序列的DNA分子上,发现它在体内的转录水平提高了200倍。而且,无论把这段72bp序列放在转录起点上游1400bp或下游3300bp处,它都有转录增强作用。增强子很可能通过影响染色质DNA-蛋白质结构或改变超螺旋的密度而改变模板的整体结构,从而使RNA聚合酶更容易与模板DNA相结合,起始基因转录。
6.转录的过程可分为3个阶段(启动→延伸→终止)
(1)转录的起始:DNA转录时,RNA聚合酶首先识别启动子并与之结合。若没有其他物质(如阻遏物)的阻隔,先形成封闭复合物,导致DNA构象改变,随后形成开放式复合物,致使DNA双链拆开成单链,最后RNA聚合酶可顺利地通过启动子开始转录。
(2)转录的延伸:转录起始复合物可以长时间的与DNA模板结合而不解离,RNA聚合酶沿着DNA信息链移动,这就使RNA新链逐渐延伸,合成RNA分子(图3-21)。
(3)转录的终止:当转录到特定区域,DNA单链上出现了折叠区段,即回文对称顺序(图3-22,3-23),再加上有其他蛋白质(如ρ因子)的参与,使DNA聚合酶不能继续前进,停止加入新核苷酸;很快从RNA-DNA复合物中解离、脱落下来,转录结束。
7.快速及定向转录
RNA伸长的速度相当快,在大肠杆菌中,37℃温度下每秒钟可合成40~50个核苷酸的长度,但在0℃时每13秒才添加一个新核苷酸。有人在0℃条件下把大肠杆菌培养在含放射性14C的尿嘧啶培养某中,经分析发现,14C标记的尿嘧啶,总是出现在RNA的3′ 端。这就说明RNA也是按5′→3′方向合成的。
8.转录后RNA需进行各种复杂的加工。
二、RNA的加工
在真核细胞的细胞核内,mRNA的最初转录产物是前体mRNA(hnRNA),它在核内存在的时间很短,经加工后进入细胞质。在加工时,前体mRNA的大部分(约90%)要被切掉。然后再拼接,才能成为成熟的mRNA。加工方式如下:
1.戴帽(capping)
(1)帽子的形成:尽管真核生物的mRNA的转录也是以嘌呤核苷三磷酸(pppA或pppG)领头的,但是人们用RNAase处理成熟的mRNA时,并没有得到预期的pppA或pppG,而是得到一个以5′-三磷酸二酯键相连的二核苷酸,而且5′ 端的一个核苷酸总是N 7-甲基鸟苷酸。这样,成熟的mRNA分子并没有自由的5′ 端。mRNA 5′ 端的这种结构就称为帽子,它是经过一系列的酶促反应生成的(图3-24)。
(2)帽子的类型:不同生物的mRNA具有不同的帽子;同种生物也常有不同的帽子。
上述的N 7-甲基鸟苷酸部分称为“0”号帽子,其符号是m7GpppX。若第一个核苷酸上添加一个甲基,为“1”号帽子。若在第二个核苷酸上再添加甲基,则构成“2”号帽子。
(3)帽子的功能:可归纳为如下几点。第一,帽子结构为核糖体对于mRNA的识别提供了信号:“0”号帽子部分的结构有利于核糖体的识别,在“1”号帽子和“2”帽子结构中的甲基化也能增进核糖体对于mRNA的结合。第二,帽子增加了mRNA的稳定性,保护mRNA免遭5′ 端外切核酸酶的攻击。
2.加尾(tailing)
(1)尾巴的类型:大多数真核生物的mRNA都具有3′ 末端的多聚(A)尾巴(poly A)。具有这种特征的mRNA表示为poly(A) ;不具有这特征的则写作poly(A)–。poly(A)尾巴长约200bp。
(2)加尾的过程:poly(A)尾巴不是由DNA编码的。而是在一个300Kda的RNA末端腺苷酸转移酶催化下,以ATP为前体,一个一个地聚合到mRNA的3′ 末端。然而,poly(A)尾巴并不是加在转录终止的3′ 末端,而是转录产物的3′ 末端由一个特异性酶的作用下切除一段,然后再由poly(A)聚合酶催化加上poly(A)尾巴。如果这识别信号发生突变,如U→G,则切除作用和多聚腺苷酸化作用均显著降低。
(3)poly(A)尾巴的功能:
推测poly(A)可能与核-质转运有关,但是相当数量(占大约1/3)的没有poly(A)尾巴的mRNA(如组蛋白mRNA),也能照样通过核膜进入细胞质。现在大多数意见是:poly(A)尾巴能尽量延长mRNA的寿命。poly(A)可使mRNA的3′ 末端结合到内质网膜上,从而使3′ 末端稳定,减少核酸酶的破坏。
(4)tRNA分子上的尾巴:在tRNA分子中的3′ 末端添加 CCA-OH,它对tRNA运载氨基酸是必需的。
3.剪接(splicing)
在真核细胞的DNA转录成的RNA分子内,有一些序列参与蛋白质的合成,这些序列称为外显子(exon);但有另一些区段或序列在成熟期被切除掉,不参与蛋白质的合成,这些序列或区段则称为内含子(intron)。
在酶的作用下,把前体mRNA内的内含子切除掉,然后将两个邻近的外显子准确地拼接起来。rRNA也如此,如哺乳动物细胞先合成45S RNA前体分子,它的寿命并不长,大约只有15分钟,随即被酶切断,有80%的长度形成了18S、5.8S 和28S rRNA分子,其余的20%转录间隔区弃置不用。
(1)内含子(intron)的发现:利用3H-uridine放射标记hnRNA的实验证明,在细胞核里有些hnRNA在30min内就从7000个核苷酸缩短到平均为1500个核苷酸的mRNA。令人奇怪的是,不管hnRNA如何缩短,但两头的5′ 帽子与poly(A)却永远存在。这暗示着从hnRNA到成熟的mRNA,不是从两头降解,而是从分子内部删除不需要的某些序列一一非编码序列。最早发现的内含子序列是在感染人类的腺病毒(adenovirus)中,随后发现在β-珠蛋白基因(β-globin gene)和卵清蛋白基因(ovalbumin gene)有内含子(图3-25)。现在已知在真核细胞中除了组蛋白基因(histone gene)与腺病毒多肽IX基因外,所有己知的真核细胞基因都有内含子(表3-11)。
表3-11 一些人类基因的剪接情况 (kb)
基 因 |
基因大小(kb) |
mRNA大小(kb) |
内含子数目 |
剪接幅度 |
β-珠蛋白 胰岛素 蛋白激酶 白蛋白 过氧化氢酶 LDL受体 凝血因子Ⅷ 甲状腺球蛋白 (肌)营养不良蛋白 |
1.5 1.7 11 25 34 45 186 300 >2000 |
0.6 0.4 1.4 2.1 1.6 5.5 9.0 8.7 17 |
2 2 7 14 12 17 25 36 >50 |
60% 76% 87% 91% 95% 87.7% 95% 97% 99% |
(2)内含子剪接的机制:内含子的大小可从80bp到10000bp以上,其序列在进化过程中经常发生突变而不致影响基因的功能。惟一保守的序列是它的5′ 剪接位点与3′剪接位点及其邻近的序列。剪接过程中主要依靠snRNP对剪接位点的识别以及snRNP的酶活性。因为snRNP中无论是RNA还是蛋白质均具有酶活性。如U1对5′剪接位点的识别是它的RNA中有导引序列与5′剪接位点的9核苷酸序列互补配对。然后在其他snRNP的协同作用下进行剪接(图3-26)。
完成了剪接的mRNA将被核孔复合体的受体所识别而输送到细胞质中。大部分在剪接中附着在RNA上的蛋白质都被留在核内。剪接过程没有完成或不能完成的RNA是不能进入细胞质的。
4.RNA的编辑(RNA editing)
它是某些RNA,特别是mRNA的一种加工方式,可导致DNA所编码的遗传信息的改变。编辑的方式主要有以下几种:
(1)改变个别碱基:如大鼠脑中谷氨酸受体蛋白mRNA经编辑后,分子有多个编码谷氨酸的密码子(GAG)变成了在控制通过神经递质的离子流过程中有重要影响的精氨酸密码子(AAG),表明RNA的编辑可能是充分发挥生理功能所必须的。载脂蛋白mRNA中C→U,谷氨酸受体蛋白mRNA中的A→I(次黄嘌呤),都属于脱氨基作用的结果,分别由胞嘧啶和腺嘌呤脱氨酶所催化。通常情况下,该酶促反应的特异性不强,腺嘌呤脱氨酶可以作用于双链RNA区的任何腺苷酸残基。但是,RNA的编辑发生在带有具催化作用的脱氨酶亚基的复合体中,有附加的RNA结合区能帮助所编辑的特异性靶位点。
(2)尿苷酸的缺失和添加:研究发现,某昆虫的细胞色素b mRNA中含有许多独立于核基因的尿嘧啶残基,而特异性插入这些残基的信息来自于指导RNA(guide RNA),因为它含有与编辑后细胞色素b mRNA相互补的核苷酸序列。指导RNA与被编辑区及周围部分核酸序列虽然有相当程度的互补性,但该RNA上存在一些未能配对的腺嘌呤,形成缺口,为插入尿嘧啶提供了模板(图3-27)。反应完成后,指导RNA从mRNA上解离下来,而mRNA则被用作翻译的模板。
核基因 AAAGCGGAGAGAAAAGAAA A G G C TTTAACTTCAGGTTGTTTATTACGAGTATATGG
↓ 转录
原始RNA AAAGCGGAGAGAAAAGAAA A G G C UUUAACUUCAGGUUCUUUAUUACGAGUAUAUGG
↓ 与指导RNA配对
原始RNA AAAGCGGAGAGAAAAGAAA A G G C UUUAACUUCAGGUUCUUUAUUACGAGUAUAUGG
指导RNA AUAUUCAAUAAUAAAUUUAAAUAUAAUAGAAAUUGAAGUUCAGUAUACACUAUAAUAAUAAU
↓ 尿嘧啶插入并释出mRNA
mRNA AAAGCGGAGAGAAAGAAAUUUAUGUUGUCUUUUAACUUCAGGUUGUUUAUUACGAGUAUAUGG
图 3-27 指导RNA和RNA的编辑机制
5.RNA的修饰(RNA modifying)
有些RNA,特别是前体rRNA 和tRNA,还可能有特异性化学修饰。图3-28是最常见的6大类化学修饰途径及其产物。研究证实,仅人细胞内rRNA分子上就存在106种甲基化和95种假尿嘧啶产物,虽然尚未发现特征性保守序列,但有实验证据表明,RNA的化学修饰可能具有位点特异性。