載脂蛋白基因的分離是通過用相應的cDNA作為探針篩選基因文庫而完成的。比較基因的核苷酸序列與cDNA的核苷酸序列得以鑒定基因的內(nèi)含子與外顯子數(shù)目以及它們的分界線。大部分真核細胞的基因含有內(nèi)含子,內(nèi)含子不編碼氨基酸,但有些內(nèi)含子參與基因表達的調(diào)控。外顯子通常占據(jù)基因內(nèi)的三個區(qū)域:第一個區(qū)域不編碼氨基酸,含有RNA轉錄起始以及導向mRNA至核糖體合成蛋白質的信號序列;第二個區(qū)域編碼信號肽、前肽以及成熟蛋白質的部分氨基酸;第三個區(qū)域除編碼成熟蛋白質的氨基酸外,還含有終止翻譯以及添加聚腺苷酸的信號。并非每個基因所含的內(nèi)含子與外顯子數(shù)目相等。真核細胞基因的這些結構特點也體現(xiàn)在載脂蛋白的基因結構中。有些載脂蛋白基因具有獨特的結構特征。本節(jié)重點介紹ApoAⅠ、AⅡ、AⅣ、CⅠ、CⅡ、CⅢ、E基因結構的類同性、載脂蛋白B基因的結構特點以及Apo(a)基因的結構特點。其他的載脂蛋白基因結構均以列表的形式介紹。
載脂蛋白AⅠ、AⅡ、AⅣ、CⅠ、CⅡ、CⅢ以及E的基因結構非常相似。除ApoAⅣ缺少第1個內(nèi)含子外,其余的載脂蛋白基因均由三個內(nèi)含子與四個外顯子組成(如圖4-1所示)。內(nèi)含子的分布位置幾乎相同。第一個內(nèi)含子截斷5"未翻譯區(qū),第二個內(nèi)含子截斷信號肽的編碼區(qū),靠近信號肽的切割部位,第三個內(nèi)含子截斷編碼成熟蛋白質的區(qū)域。盡管ApoAⅣ缺少第一個內(nèi)含子,它的第二及www.med126.com第三內(nèi)含子的分布與其他載脂蛋白相同。載脂蛋白AⅠ、AⅡ、CⅠ、CⅡ、CⅢ、E基因的前三個外顯子以及ApoAⅣ基因的前二個外顯子的長度頗為相近,它們之間長度的不同主要取決于第四個或第三個(ApoAⅣ)外顯子的長短。這七種載脂蛋白基因結構的類同支持如下假說,即這些基因起源于一個共同的前體,通過部分或完全的基因重復的機制衍化而來。
圖4-1 載脂蛋白AⅠ、AⅡ、AⅣ、CⅠ、CⅡ、CⅢ以及E的基因結構示意圖
寬方塊代表外顯子,細線代表內(nèi)含子或5"及3"側翼區(qū)。在外顯子區(qū)內(nèi):兩端的空方塊代表5"及3"未翻譯區(qū);斜線方塊代表信號肽區(qū);位于信號肽與成熟肽之間的窄空方塊代表前肽(Prosegment)區(qū)。圖中的數(shù)值表示各個外顯子的長度(核苷酸對的數(shù)目)。(源出:L.Chan,Klin.Wochenschr.67:227,1989)
與上述載脂蛋白基因的結構相比較,載脂蛋白B的基因結構具有顯著的差異。后者長達43000核苷酸堿基對,含有28個內(nèi)含子與29個外顯子。其中外顯子26與gydjdsj.org.cn/kuaiji/29分別長達7572與1906堿基對。外顯子26編碼載脂蛋白B的第1379至3903個氨基酸,它比迄今為止所發(fā)現(xiàn)的哺乳動物基因的任何外顯子都長3倍之多。這種特長的外顯子是否由一些短外顯子融合所致尚不清楚。在載脂蛋白B的內(nèi)含子中,已發(fā)現(xiàn)有6種重復DNA序列。其中某些特征序列模式已成為流行病學及家族研究的工具。
載脂蛋白B基因表達的產(chǎn)物有ApoB100和ApoB48,前者由4536個氨基酸組成,后者包含2152個氨基酸。載脂蛋白B48是由小腸RNA剪切酶修飾ApoB信使RNA所產(chǎn)生的。小腸ApoB信使RNA在第6666個核苷酸的位置上含U,而肝ApoB信使RNA的同一位置上為C。由U取代C導致了一個終止翻譯密碼子(UAA)的產(chǎn)生。UAA取代了編碼ApoB100第2153個氨基酸谷氨酰胺的CAA密碼子。故在小腸ApoB基因表達的產(chǎn)物ApoB48僅含2152個氨基酸。約占ApoB100組成的48%(見圖4-2)。這種ApoB信使RNA剪切機制在哺乳動物的分子生物學研究領域內(nèi)是空前未有的先例。這種機制的存在有何生理意義還待進一步的探討。
圖4-2 載脂蛋白B基因結構以及ApoB100與ApoB48合成示意圖
載脂蛋白B基因的29個外顯子均由豎線表示出來,其中兩個特長的外顯子26個和29作了特別的標記。位于外顯子之間的28個間隙代表28個內(nèi)含子。圖中的堿基對數(shù)目分別代表載脂蛋白B基因、載脂蛋白B100信使RNA以及ApoB48信使RNA的長度。UAA和TAA為終止翻譯密碼子,CAA為編碼谷氨酰胺的密碼子。(源自Young S G Circulation82(5):1597,1990)
載脂蛋白(a)的基因由10~45個內(nèi)含子和11~46個外顯子組成(見圖4-3A)。這種變異主要取決于Kringle(丹麥烤卷餅)-4功能區(qū)的數(shù)目,此數(shù)目可高達37。其中24個Kringle-4功能區(qū)核苷酸序列完全相同,均由342核苷酸堿基對組成。第24、27、28及29區(qū)僅相異于3個核苷酸。其他的區(qū)有11~71核苷酸序列的不同。Apo(a)基因的結構與血纖維蛋白溶酶原的基因結構相似(見圖4-3A與圖4-1B)。其中信號肽編碼區(qū)100%的等同。其他區(qū)域的類似程度在75%~94%不等。這提示Apo(a)與血纖維蛋白溶酶原基因由同一個前體衍化而來。正是由于這個類同性,脂蛋白(a)不僅與脂類代謝有關。而且也參與血液凝固的機制。
圖4-3 Apo(a)與血纖維蛋白溶酶原基因結構(A)與cDNR結構(B)的比較
在圖4-3A中,數(shù)值Ⅰ-XIX標記的豎棒代表外顯子的數(shù)目與序列。外顯子間的間隙為內(nèi)含子。在Apo(a)的基因結構中,n代表Kringle-4功能區(qū)的數(shù)目是變動的,可高達37。在圖4-3B中,S代表信號肽:T代表“尾巴”區(qū);Ⅰ-Ⅴ分別代表Kringle-5功能區(qū);P代表蛋白酶功能區(qū)。血纖維蛋白溶酶原與Apo(a)各功能區(qū)的相似程度(%)標記在圖B的下部。(源自:Ichinose A. Biochemistry31:3115,1992 and Mclean et al. Nature 330:136,1987.)
四、人體載脂蛋白基因結構一覽表
表4-1列出所有已經(jīng)鑒定的人體載脂蛋白的基因結構,即內(nèi)含子與外顯子的組成以及基因表達后的產(chǎn)物信號肽、前肽及成熟肽的分布。表中附有的文獻索引供進一步查閱時參考。
表4-1 人體載脂蛋白基因的結構特征
基因 | 內(nèi)含子 | 外顯子 | 信號肽 | 前肽 | 成熟肽 | 參考文獻 |
AⅠ | 3 | 4 | 18 | 6 | 243 | 6 |
AⅡ | 3 | 4 | 18 | 5 | 77 | 7 |
AⅣ | 2 | 3 | 20 | 0 | 377 | 8 |
(a) | 10-45 | 11-46 | 19 | 0 | 4.529 | 4.5 |
B | 28 | 29 | 27 | 0 | 4.536 | 9 |
CⅠ | 3 | 4 | 26 | 0 | 57 | 10.2 |
CⅡ | 3 | 4 | 22 | 0 | 79 | 11 |
CⅢ | 3 | 4 | 20 | 0 | 79 | 12a |
CⅣ | 2 | 3 | 25 | 0 | 102 | 12b |
D | 4 | 5 | 20 | 0 | 169 | 13 |
E | 3 | 4 | 18 | 0 | 299 | 14 |
F | * | * | 22 | 0 | 286 | 15 |
G* | ||||||
H | * | * | 19 | 0 | 326 | 16 |
J | 8 | 9 | ? | 0 | 427 | 17.27 |
*:尚未見有關資料報道。