重疊基因
A+醫(yī)學(xué)百科 >> 重疊基因 |
所謂重疊基因(overlapping gene)是指兩個(gè)或兩個(gè)以上的基因共有一段DNA序列,或是指一段DNA序列成為兩個(gè)或兩個(gè)以上基因的組成部分。重疊基因有多種重疊方式。例如,大基因內(nèi)包含小基因;前后兩個(gè)基因首尾重疊一個(gè)或兩個(gè)核苷酸;幾個(gè)基因的重疊,幾個(gè)基因有一段核苷酸序列重疊在一起,等等。重疊基因中不僅有編碼序列也有調(diào)控序列,說明基因的重疊不僅是為了節(jié)約堿基,能經(jīng)濟(jì)和有效地利用DNA遺傳信息量,更重要的可能是參與對基因的調(diào)控?! ?/p>
發(fā)現(xiàn)
重疊基因 是在1977年發(fā)現(xiàn)的。早在1913年A.H.斯特蒂文特已在果蠅中證明了基因在染色體上作線狀排列,50年代對基因精細(xì)結(jié)構(gòu)和順反位置效應(yīng)等研究的結(jié)果也說明基因在染色體上是一個(gè)接著一個(gè)排列而并不重疊。但是1977年F.桑格在測定噬菌體ΦX174的DNA的全部核苷酸序列時(shí),卻意外地發(fā)現(xiàn)基因D中包含著基因E。基因E的第一個(gè)密碼子(見遺傳密碼)從基因D的中央的一個(gè)密碼子TAT的中間開始,因此兩個(gè)部分重疊的基因所編碼的兩個(gè)蛋白質(zhì)非但大小不等,而且 氨基酸 也不相同。在某些真核生物病毒中也發(fā)現(xiàn)有重疊基因?! ?/p>
斷裂的基因
也是在1977年發(fā)現(xiàn)的,它是內(nèi)部包含一段或幾段最后不出現(xiàn)在成熟的mRNA中的片段的基因。這些不出現(xiàn)在成熟的mRNA中的片段稱為內(nèi)含子,出現(xiàn)在成熟的mRNA中的片段則稱為外顯子。例如下面這一基因,有三個(gè)外顯子和兩個(gè)內(nèi)含子。在幾種哺乳動物的核基因、酵母菌的線粒體基因以及某些感染真核生物的病毒中都發(fā)現(xiàn)了斷裂的基因。內(nèi)含子的功用以及轉(zhuǎn)錄后的加工機(jī)制是真核生物分子 遺傳學(xué) 的一個(gè)吸引人的課題?! ?/p>
可以移動位置的基因
(見轉(zhuǎn)座因子)首先于40年代中在玉米中由B.麥克林托克發(fā)現(xiàn),當(dāng)時(shí)并沒有受到重視。60年代末在細(xì)菌中發(fā)現(xiàn)一類稱為插入序列的可以轉(zhuǎn)移位置的 遺傳因子 IS,它們本身沒有表型效應(yīng),可是在插入別的基因中間時(shí)能引起插入突變。70年代早期又發(fā)現(xiàn)細(xì)菌質(zhì)粒上的某些抗藥性基因可以轉(zhuǎn)移位置。細(xì)菌中的這類轉(zhuǎn)座子(Tn)到80年代已經(jīng)發(fā)現(xiàn)不下20種,它們分別帶有不同的抗藥性基因,能在不同的復(fù)制子之間轉(zhuǎn)移位置,例如從質(zhì)粒轉(zhuǎn)移到染色體、噬菌體以及別的質(zhì)粒上等。當(dāng)他們轉(zhuǎn)移到某一基因中間時(shí),便引起一個(gè)插入突變。類似于細(xì)菌轉(zhuǎn)座子的可以轉(zhuǎn)移位置的遺傳因子在玉米以外的真核生物中也已經(jīng)發(fā)現(xiàn),例如酵母菌中的接合因子基因,以及果蠅白眼基因中的 轉(zhuǎn)座因子 等。轉(zhuǎn)座因子的研究也已成為分子遺傳學(xué)中的一個(gè)重要方面。
功能、類別和數(shù)目到目前為止在果蠅中已經(jīng)發(fā)現(xiàn)的基因不下于1000個(gè),在 大腸桿菌 中已經(jīng)定位的基因大約也有1000個(gè),由基因決定的性狀雖然千差萬別,但是許多基因的原初功能卻基本相同。
1945年G.W.比德爾通過對脈孢菌的研究,提出了一個(gè)基因一種酶假設(shè),認(rèn)為基因的原初功能都是決定蛋白質(zhì)的一級結(jié)構(gòu)(即編碼組成肽鏈的氨基酸序列)。這一假設(shè)在50年代得到充分的驗(yàn)證。
重疊基因(everlapping gene):指兩個(gè)或兩個(gè)以上的結(jié)構(gòu)基因共同一段DNA順序的現(xiàn)象重疊基因 原核生物和一些病毒或噬菌體的基因組比較小,核苷酸對是極其有限的,那么怎樣有效地利用這些有限堿基來編碼更多的遺傳信息呢?在生物中存在著一種十分巧妙的機(jī)制——重疊基因 (overlapping gene)。它的道理就像我們古代的回文詩一樣,如: 蓮人在綠楊津 采 一 玉漱聲歌新闕 其讀法是:采蓮人在綠楊津,在綠楊津一闕新,一闕新歌聲漱玉,歌聲漱玉采蓮人。本來需要28個(gè)字才能表達(dá)完的一首詩,現(xiàn)在利用前后兩句之間的幾個(gè)字的重疊,結(jié)果只用了14個(gè)字就完成了。重疊基因也正是如此,利用堿基的重疊來編碼更多的信息。 重疊基因是在1977年首先發(fā)現(xiàn)的,當(dāng)時(shí)美國著名的科學(xué)家Sanger建立了測序方法,他就用這種測序方法對環(huán)狀單鏈的噬菌體F×174進(jìn)行了測序。結(jié)果測出其基因組由5386個(gè)核苷酸組成,共有11個(gè)基因,構(gòu)成3個(gè)轉(zhuǎn)錄單位,由3個(gè)啟動子(pA,pB,pD)啟動。(圖10-4)基因的產(chǎn)物都已被分離,它們所含的氨基酸已遠(yuǎn)遠(yuǎn)地超過了5386個(gè)堿基所能編碼的量,即F-174含有的5386Nt最多能編碼1795個(gè)氨基酸,若每個(gè)氨基酸的平均分子量為110,則總的蛋白質(zhì)分子量為197,000D,但實(shí)際測出的蛋白質(zhì)總分子量卻為262,000D。將全部DNA順序和蛋白質(zhì)的氨基酸順序進(jìn)行比較,發(fā)現(xiàn)B基因在A0基因之中,K基因跨在A-C兩基因的連接處,和A0基因的尾部,C基因的首部相重疊,E基因在D基因內(nèi)部。類似的情況在別的噬菌體如G4、微小病毒和SV40也有發(fā)現(xiàn)。重疊基因不僅可經(jīng)濟(jì)利用基因組,而且可能起表達(dá)調(diào)控的作用 重疊基因僅在噬菌體和病毒中存在,在真核生物中尚未發(fā)現(xiàn)重疊基因。這可能因?yàn)榍罢呋蚪M比較小,但又必須要編碼一些維持其生命和繁殖的基因,在選擇的壓力下,保留了這種重疊基因的形式。在本世紀(jì)70年代以前,人們一直認(rèn)為遺傳物質(zhì)是雙鏈DNA,在上面排列的基因是連續(xù)的。Robert and Sharp徹底改變了這一觀念。他們以腺病毒作為實(shí)驗(yàn)對象,因?yàn)樗呐帕行蛄型渌叩葎游锖芙咏?,包括人。結(jié)果發(fā)現(xiàn)它們的基因在DNA上的排列由一些不相關(guān)的片段隔開,是不連續(xù)的。 他們的發(fā)現(xiàn)改變了科學(xué)家以往對進(jìn)化的認(rèn)識,對于現(xiàn)代生物學(xué)的基礎(chǔ)研究以及生物進(jìn)化論具有重要的奠基作用,對于腫瘤以及其他遺傳性疾病的醫(yī)學(xué)導(dǎo)向研究,亦具有特別重要的意義。真核生物的基因組十分復(fù)雜,DNA的含量也比原核生物的大得多。噬菌體由于基因組很小,但又要編碼一些必不可少的蛋白,堿基顯然不夠用,這樣不僅幾乎所有的堿基都參加編碼,而且在進(jìn)化中還出現(xiàn)了“重疊基因”,以有限的基因編碼更多的遺傳信息。真核基因組正好相反,DNA十分富余,這樣不僅無需“重疊基因”,而且很多序列不編碼,如重復(fù)序列、間隔序列 (spacer) 和間插序列(intervening sequence) 即內(nèi)含子(intron)等。但不編碼并不等于沒有功能。有的我們可能還不了解,如重復(fù)序列。間隔區(qū)和間插序列這兩個(gè)概念是不同的,間隔區(qū)是指基因間不編碼的部分,有的轉(zhuǎn)錄稱轉(zhuǎn)錄間隔區(qū)(TS),有的不轉(zhuǎn)錄稱為非轉(zhuǎn)錄間隔區(qū)(NTS)。間插序列是指基因內(nèi)部不編碼的區(qū)域,也稱內(nèi)含子,在初始轉(zhuǎn)錄本中存在此序列,但在加工后將被切除掉,所以常不作為翻譯的信息。間隔區(qū)常常含有轉(zhuǎn)錄的啟動子和其它上游調(diào)節(jié)序列。有的內(nèi)含子也可以編碼,如成熟酶和內(nèi)切酶等。在遺傳學(xué)上通常將能編碼蛋白質(zhì)的基因稱為結(jié)構(gòu)基因。真核生物的結(jié)構(gòu)基因是斷裂的基因。一個(gè)斷裂基因能夠含有若干段編碼序列,這些可以編碼的序列稱為外顯子。在兩個(gè)外顯子之間被一段不編碼的間隔序列隔開,這些間隔序列稱為內(nèi)含子。每個(gè)斷裂基因在第一個(gè)和最后一個(gè)外顯子的外側(cè)各有一段非編碼區(qū),有人稱其為側(cè)翼序列。在側(cè)翼序列上有一系列調(diào)控序列(圖3-3)。調(diào)控序列主要有以下幾種:①在5′端轉(zhuǎn)錄起始點(diǎn)上游約20~30個(gè)核苷酸的地方,有TATA框(TATA box)。 TATA框是一個(gè)短的核苷酸序列,其堿基順序為TATAATAAT。TATA框是啟動子中的一個(gè)順序,它是RNA聚合酶的重要的接觸點(diǎn),它能夠使酶準(zhǔn)確地識別轉(zhuǎn)錄的起始點(diǎn)并開始轉(zhuǎn)錄。當(dāng)TATA框中的堿基順序有所改變時(shí),mRNA的轉(zhuǎn)錄就會從不正常的位置開始。②在5′端轉(zhuǎn)錄起始點(diǎn)上游約70~80個(gè)核苷酸的地方,有CAAT框(CAAT box)。CAAT框是啟動子中另一個(gè)短的核苷酸序列,其堿基順序?yàn)镚GCTCAATCT。CAAT框是RNA聚合酶的另一個(gè)結(jié)合點(diǎn),它的作用還不很肯定,但一般認(rèn)為它控制著轉(zhuǎn)錄的起始頻率,而不影響轉(zhuǎn)錄的起始點(diǎn)。當(dāng)這段順序被改變后,mRNA的形成量會明顯減少。③在5′端轉(zhuǎn)錄起始點(diǎn)上游約100個(gè)核苷酸以遠(yuǎn)的位置,有些順序可以起到增強(qiáng)轉(zhuǎn)錄活性的作用,它能使轉(zhuǎn)錄活性增強(qiáng)上百倍,因此被稱為增強(qiáng)子。當(dāng)這些順序不存在時(shí),可大大降低轉(zhuǎn)錄水平。研究表明,增強(qiáng)子通常有組織特異性,這是因?yàn)椴煌?a href="/w/%E7%BB%86%E8%83%9E%E6%A0%B8" title="細(xì)胞核">細(xì)胞核有不同的特異因子與增強(qiáng)子結(jié)合,從而對不同組織、器官的基因表達(dá)有不同的調(diào)控作用。例如,人類胰島素基因 5′末端上游約250個(gè)核苷酸處有一組織特異性增強(qiáng)子,在胰島素β細(xì)胞中有一種特異性蛋白因子,可以作用于這個(gè)區(qū)域以增強(qiáng)胰島素基因的轉(zhuǎn)錄。在其他組織細(xì)胞中沒有這種蛋白因子,所以也就沒有此作用。這就是為什么胰島素基因只有在胰島素β細(xì)胞中才能很好表達(dá)的重要原因。④在3′端終止密碼的下游有一個(gè)核苷酸順序?yàn)锳ATAAA,這一順序可能對mRNA的加尾(mRNA尾部添加多聚A)有重要作用。這個(gè)順序的下游是一個(gè)反向重復(fù)順序。這個(gè)順序經(jīng)轉(zhuǎn)錄后可形成一個(gè)發(fā)卡結(jié)構(gòu)(圖3-4)。發(fā)卡結(jié)構(gòu)阻礙了RNA聚合酶的移動。發(fā)卡結(jié)構(gòu)末尾的一串U與轉(zhuǎn)錄模板DNA中的一串A之間,因形成的氫鍵結(jié)合力較弱,使mRNA 與DNA雜交部分的結(jié)合不穩(wěn)定,mRNA就會從模板上脫落下來,同時(shí),RNA聚合酶也從DNA上解離下來,轉(zhuǎn)錄終止。AATAAA順序和它下游的反向重復(fù)順序合稱為終止子,是轉(zhuǎn)錄終止的信號。
關(guān)于“重疊基因”的留言: | 訂閱討論RSS |
目前暫無留言 | |
添加留言 |