人類基因組包括細胞核內(nèi)的基因組及細胞質(zhì)內(nèi)線粒體基因組,它們大致結構如圖3-8。
圖3-8 人類基因組結構
一、細胞核基因組
每條染色體含1個DNA分子,1個細胞的全部遺傳信息(基因)都編碼在線狀的DNA分子上。由于每個體細胞中有2套染色體(2n),故所含的DNA是由兩個基因組(genome)構成。每個單倍體基因組約含3.2×109bp。人類基因的平均長度為1-1.5kb,所以基因組以足以編碼1.5×106蛋白質(zhì),但實際上編碼蛋白質(zhì)的結構基因只不過5萬-10萬個,僅占總基因組的2%-3%。其余的DNA順序包括基因之間的間隔順序、基因內(nèi)插入順序、重復順序等。目前,對它們的功能知之甚少,絕大多數(shù)重復順序只不過是過剩的DNA。但是,其中一些則有著特殊的功能,包括:調(diào)節(jié)基因的表達,增強同源染色體之間的配對和重組,維持染色體結構,調(diào)節(jié)前mRNA的加工以及參與DNA的復制等。
。ㄒ)單一順序
單一順序(unique sequence)約占基因組的60%-65%,這種順序在一個基因組中一般僅有單個或幾個拷貝,大多數(shù)編碼蛋白質(zhì)和酶基因?qū)儆诖祟悺我豁樞蜻以間隔順序和散在分布在重復順序構成側翼。
(二)重復順序
重復順序(repetitive sequence)是指在一個基因組中有很多拷貝,又可分為幾類:
1.高度重復順序(highly repetitive sequence) 其長度可能2、4、6、8等幾個bp,較長的順序可達200bp,但是重復拷貝數(shù)可達106次以上,例如染色體著絲粒、端粒和Y染色體長臂上的異染區(qū)就是由高度重復順序的衛(wèi)星DNA(satellite DNA)構成的,高度重復順序不能轉(zhuǎn)錄,它們參與染色體結構的維持,形成結構基因間隔,可能與減數(shù)分裂時同源染色體的聯(lián)會配對有關。
2.中度重復順序(moderately repetitive sequence) 其長度300-7000bp,一般都是不編碼的順序。據(jù)認為在基因調(diào)控中起重要作用,包括開啟或關閉基因,促進或終止轉(zhuǎn)錄,DNA復制的起始,參與前mRNA加工等。例如人類Alu家族(Alu family),占人類基因組的3%-6%,由300bp構成,在第170位附近都AGCT順序,可被內(nèi)切酶AluⅠ所切割(AG↓CT)故得名。這些順序在基因中重復達30-50萬次,平均5kbDNA就有一個Alu順序。此外還有KpnⅠ家族(KpnⅠfamily),約占基因組的3%-6% ,由3000-4800個拷貝構成,其功能不詳。此外,還有小衛(wèi)星DNA和微衛(wèi)星DNA(參閱第十三章)。
3.基因家族和基因簇真核基因組中有許多來源相同.結構相似.功能相關的基因,這組基因稱為基因家族(gene family);蚣易宓某蓡T可以分布于幾條不同染色體上,也可集中于一條染色體上。集中成簇的一組基因稱為基因簇(gene cluster)。例如人類白細胞抗原(HLA)系統(tǒng)的7個連鎖基因座位,排列成A-C-B-D-DR-DQ-DP,形成一個基因簇。此外,人類的類α和β珠蛋白基因簇分別集群串聯(lián)排列于16p13和11p15上,而組蛋白基因簇則群集于7q32-q36。有些基因家族的成員并不集中排列為基因簇,而是散布在基因組中不同部位,如微管蛋白基因家簇,微管相關蛋白2(MAP2)定位于2q34-q35,微管相關蛋白tau,β(MAPT1)定位于17q21,微管相關蛋白tau-2(MAPT2)定位于6q21。
。ㄈ)假基因
在基因家族中的某些成員并不產(chǎn)生有功能的基因產(chǎn)物,稱為假基因(pseudogene),如Ψξ、Ψα、Ψβ等。假基因起始也可能有功能,后來由于缺失、倒位或點突變等原因使這些基因成為無功能的基因。假基因可以與有功能基因連鎖,也可以由于染色體易位或作為轉(zhuǎn)座子,從一部位移到另一新的部位。
此外,人類基因組中還有一些特殊的短順序位于各基因的側翼,它們是起到調(diào)控作用的調(diào)節(jié)順序(啟動子、增強子等)。有的是與細胞惡性轉(zhuǎn)化有關的原癌基因(proto-onco-gene)等構成了五花八門的人類基因組結構。
二、線粒體基因組
人類線粒體DNA(mitochondrial DNA,mtDNA)是獨立于細胞核染色體外的又一基因組,它能自主復制,由16569個堿基對組成,每一個mtDNA分子為環(huán)狀雙鏈DNA分子,外環(huán)為重鏈,內(nèi)環(huán)為輕鏈。基因組含有37個基因,其中13個為蛋白質(zhì)基因(包含1個細胞素b基因,2個ATP酶復合體組成成分基因,3個細胞色素c氧化酶亞單位的基因及7個呼吸鏈NADH脫氫酶亞單位的基因),2個為rRNA基因,還有22個tNRA基因(圖3-9)。
圖3-9 人類線粒體基因組H:重鏈;L:輕鏈
ND1-ND6:基因編碼NADH脫氫酶亞單位CO1-CO3:基因
編碼細胞色素C氧化酶亞單位1-3CYB:基因編碼細胞色素b
人類線粒體基因組具有下列特點:
1.人類線粒體的基因排列得非常緊湊,除與mtDNA復制及轉(zhuǎn)錄有關的一小段區(qū)域外,無內(nèi)含子序列。在37個基因之間,基因間隔區(qū)總共只有87bp,只占DNA總長度的的0.5%,有些基因之間沒有間隔,有時基因有重疊,即前一個基因的最后一段堿基與下一個基因的第一段堿基相銜接。因此,mtDNA的任何突變都會累及到基因組中一個重要功能區(qū)域。
2.mtDNA為高效利用DNA。有5個閱讀框架,缺少終止密碼子,僅以U或UA結尾。
3.mtDNA的突變率高于核中DNA,并且缺乏修復能力。
4.mtDNA為母系遺傳。
5.部分mtDNA的密碼子不同于核內(nèi)DNA的密碼子。
遺傳密碼是在長期進化中形成并保持不變的,因此細胞核內(nèi)所列的密碼是一種通用密碼,但是真核生物線粒體的密碼卻有若干處不同于通用密碼。以人類線粒為例:①UGA不是終止密碼子,而是色氨酸的密碼子;②AGA、AGG不是精氨酸的密碼子而是終止密碼子。這樣,加上通用密碼中的UAA和UAG,線粒體共有4個終止密碼子;③內(nèi)部甲硫氨酸密碼子有2個,即AUG和AUA,起始甲硫酸密碼子有4個,即AUN。
總之,線粒體的密碼表排列得比較整齊,各種氨基酸的密碼子以及起始和終止密碼子的數(shù)目或是2,或是4,或是6。
目前,由于發(fā)現(xiàn)有些遺傳病如Leber遺傳性視神經(jīng)病,肌陣攣性癲癇等與線粒體基因突變有關,因而它的基因結構引起普遍關注。