假基因也叫伪基因,他是基因家族在进化过程中形成的无功能的残留物。它与正常基因相似,但丧失正常功能的DNA序列,往往存在于真核生物的多基因家族中,常用ψ表示。1
假基因可视为基因组中与编码基因序列非常相似的非功能性基因组 DNA 拷贝,一般情况都不被转录,且没有明确生理意义。 根据其来源可分为保留了间隔序列的复制假基因(如珠蛋白假基因家族)和缺少间隔序列的已加工假基因。
假基因的发现是在真核生物的研究中应用和技术而取得的成果。第一个假基因是1977年在研究非洲爪蟾核糖体5SRNA的基因时发现的。以后又发现编码蛋白质的结构基因也有相应的假基因,如小鼠、兔和人的或β珠蛋白的假基因等。
特征大部分假基因在染色体上都位于正常基因的附近,但也有位置在不同的染色体上的。假基因和正常基因的结构上的差异包括在不同部位上的程度不等的缺失或插入、在内含子和外显子邻接区中的顺序变化、在5'端启动区域的缺陷等。这些变化往往使假基因不能转录并形成正常的(mRNA)从而不能表达。2
产生方式复制
即复制后基因发生序列变化而失去功能,这样产生的假基因带有内含子,称为non-processed或duplicatedpseudogenes
反座
即mRNA转录本经过反转录为cDNA,再插入基因组,由于插入位点不合适或序列发生变化而导致失去功能。这种类型的假基因不含内含子,被称为processedpseudogenes,或retropseudogene。3
代表加工假基因有一类假基因除了一般的特征之外,还有一些其他的特征暗示着它们的形成与mRNA有关:
①在假基因中完全缺少在相应的正常基因中存在的内含子顺序;
②在假基因的3'末端有一段连贯的脱氧腺嘌呤核苷酸;
③有些假基因与相应的正常基因在顺序组成上的相似性只限于相应的mRNA的3'末端之前的部分序列
所有这些特征都酷似具有内含子的正常基因的转录产物经加工后形成的mRNA。据此推测这种假基因的DNA顺序可能不是来自正常基因的直接复制品,而是以mRNA为中介的正常基因的间接复制品,所以又称为加工基因。例如编码人的免疫球蛋白的轻链、β微管蛋白、小鼠的珠蛋白以及大鼠的微管蛋白基因的假基因都是加工基因。加工基因可能是在真核生物细胞中的mRNA先经反向转录形成DNA,再整合到染色体上而形成的。已知致癌的RNA病毒具备这种机制,然而假基因形成的真正机制仍然是一个正在研究中的课题。
人类假基因迄今为止,明确鉴定的人类假基因多为已加工假基因,有8000个之多。在Swiss-Prot/TrEMBL收录的编码蛋白质的将近25500个基因序列中,约10%在基因组中有一个或多个近全长已加工假基因。其余的功能基因都没有已加工假基因。核糖体蛋白基因具有最多数量的已加工假基因,约有1700个(占已加工假基因数的22%),少数基因,如cyclophilinA、肌动蛋白(actin)、角蛋白(keratin)、GAPDH、细胞色素C(cytochromec)和nucleophosmin等则有很多份已加工假基因。总体上讲,假基因在人类染色体上的分布与染色体长度成比例,但已加工假基因在GC含量为41%~46%的染色体区域密度最高。已加工假基因的拷贝数和功能基因在生殖器官中的表达高度一致,说明许多假基因发生在胚胎阶段,另外也和基因中GC含量和基因大小密切相关。假基因的准确鉴定对基因组进化、分子医学研究和医学应用具有重要意义。
人α-珠蛋白基因座的一个假基因ψαl,同三个有功能的α-珠蛋白基因在DNA序列上是相似的,只是假基因中含很多突变,如起始密码子ATG变成GTG;5’端的两个内含子也有突变,可能是破坏了RNA剪接;在编码区内也有许多点突变和缺失。DNA序列比较表明,ψαl,假基因同有功能的α2基因的序列相似性达73%。ψαl假基因被认为是由α-珠蛋白基因复制产生的。开始时,这个复制生成的基因是有功能的,后来在进化的某个时期产生了一个失活突变。由于该基因是复制生成的,所以尽管失去了功能,但是不致影响到生物体的存活。随后在假基因中又积累了更多的突变,从而形成了现今的假基因的序列。人的δ-珠蛋白基因编码两种β类珠蛋白中的一种,但其mRNA水平很低,编码生成的蛋白质也不是必不可少的,因为成年人还同时表达产生另一种β类珠蛋白,所以δ-珠蛋白基因被认为是介于功能基因同无功能假基因之间的一种中间物。
返座假基因编码潜能
到目前为止,少数无致命突变而可能存在编码能力的返座假基因已作功能研究,如人metallothioneinⅡ假基因,鼠L32核糖体蛋白的一个假基因rpL32-4A等等。人metallothioneinⅡ假基因5’端上游缺乏RNA聚合酶Ⅱ转录所需的各种元件,且在Hela细胞及鼠L细胞中未发现转录活性。鼠L32核糖体蛋白的一个假基因rpL32-4A的5’端上游-30bp位置上有“ATA” 盒(RNA聚合酶Ⅱ转录所需元件之一),虽然其转录活性未经直接检测,但对其序列的甲基化程度研究显示,它可能不被转录。所以,返座假基因可能在其插入基因组时就失活了,即它们不能被RNA聚合酶Ⅱ转录而形成有活性的mRNA。考虑到返座假基因是随机插入到哺乳动物基因组中,能准确插入到一个RNA聚合酶Ⅱ启动子下游的可能性是很小的。在一些极罕见的例子中,即从mRNA上游启始的异常转录本(往往由RNA聚合酶Ⅲ转录)可能带有正常的启动子序列,从而能够产生一个有功能活性的返座基因(retrogene),如鼠前胰岛素原Ⅰ基因。
机理
对于许多已知的返座假基因,如肌管蛋白假基因、肌动蛋白假基因、葡萄糖-3-磷酸脱氢酶等等,它们的功能基因能够在非分化细胞(如生殖细胞和非分化的肿瘤细胞)中表达。这些返座假基因的长度和多聚腺嘌呤尾提示着它由RNA聚合酶Ⅱ转录而来。上面提到的异常转录本(如人免疫球蛋白ε及λΨ1假基因和鼠Ψα3-珠蛋白假基因被认为可能是由RNA聚合酶Ⅲ转录而来。Mathias等认为有自主返座能力的长散布重复序列L1产生的蛋白质能够作用于Alu转座子及细胞的mRNA(如返座假基因)并促进其返座。Luan等在对昆虫非长末端重复元件(non-LTRelement)R2BM的研究基础上,提出了目标引导反转录(target-primedreversetranscription,TPRT)的返座机制。尽管一些资料已证实这种机制,但所提出的返座途径的具体步骤仍存在未解决的问题。
作用
在进化年代上,所有的返座假基因都在哺乳动物辐射(mammalianradiation)之后出现,即返座假基因只存在于哺乳动物中。人DHFRΨ1假基因在人群中甚至还有一定的多态性。由于返座假基因对于物种本身没有提供什么明显的选择优势,因此曾被认为是一种“分子寄生物”(molecularparasite)。现在普遍认为,产生大量返座假基因的非病毒返座作用(retroposition)作为一种进化的主要动力,通过促进序列连续性的复制、散布和重组,保持着真核生物基因组的流动性(fluidity)。由于基因组的流动性保证了胞核和胞质这两个不同遗传区域的遗传信息的持续交换,通过遗传信息复制性散布产生大量新的序列组合的返座作用就能从很多不同的方面来塑造和重塑真核生物基因组。假基因与内含子、卫星序列、转位因子等冗余DNA一样,是不受进化的负选择作用的。从这个意义上说,假基因是功能基因的“弃儿”。但正是这些看似无用的遗传变异为物种进化的正选择、负选择以及中性漂变提供了丰富的原材料,从而成为物种进化不可或缺的有用“工具”。
作用Hirotsune博士指出:“这些发现将有助于未来人类疾病的治疗。当老鼠的假基因
功能被阻断,疾病就产生了,因此,理论上来说,假基因的功能异常也可能是导致人类疾病产生的因子。”其实这项发现是随机发生的,因为当时研究人员是为了另一项完全不同的实验制作转殖鼠,他们将DNA注入受精卵,使得DNA随机嵌入老鼠的基因组。Wynshaw-Boris博士表示:“我们期望转殖鼠会因为注入基因的影响而表现出直接的反应,如此一来,我们便可以从中学习到这项基因的功能。然而,由于注入的基因是随机嵌入老鼠原有基因组中的,因此会偶然中断老鼠其他基因的功能,老鼠便出现预想不到的特征;我们就发现一组老鼠出现不寻常且严重的病征。”那组老鼠几乎都死亡,存活下来者出现严重肾脏及骨骼疾病,并且会将这些缺陷传给下一代,因此研究人员决定进一步研究这项意想不到的发现。Wynshaw-Boris博士研究发现基因嵌入位点有三个基因,进一步的研究排除了两项基因,因而认定这第三项基因---假基因makorin1-p1为老鼠产生异常的主要祸首。Hirotsune表示:“由于假基因是没有能力产生蛋白的,因此我们很想知道这假基因是如何使老鼠产生疾病的?”
研究人员还发现,假基因makorin1-p1为一碎片基因,它类似于一完整的蛋白基因称为makorin1,此makorin1位于另一染色体上。 正常老鼠肾脏中有大量表现的makorin1蛋白,而当假基因makorin1-p1失去功能时,makorin1蛋白的表现也相对减弱且呈现异常,进一步的研究结果发现,makorin1-p1在调节makorin1的稳定度上扮演非常重要的角色。
本词条内容贡献者为:
魏大勇 - 副教授 - 西南大学