发展史
定向进化发展初期,科学家主要将其用于筛选和控制(或影响)所需表型。20 世纪中期,蛋白质定向进化被引入实验室用于再现和研究自然进化进程.近年,定向进化更多地被用来改善蛋白质性能,改进蛋白质药物的稳定性、半衰期、免疫原性,开发酶的新底物利用以及改进或拓展新的代谢途径等。最近的研究表明,蛋白质定向进化被成功地应用在代谢途径的关键酶设计、新底物催化功能的开发、创造全新功能蛋白质以及筛选和鉴别预期功能蛋白质中,在代谢工程和合成生物学领域发挥了重要作用1。
常用策略蛋白质定向进化的本质是构建分子多样性文库以及从文库中筛选到性状有改进的突变体,根据文库构建原理的不同,可分为随机进化、改组技术、半理性进化和理性进化四种策略,其大致思路均为由某一靶基因或一族相关的家族基因起始,通过对编码基因进行突变或重组,创建分子多样性文库;筛选文库获得能够编码改进性状的基因,作为下一轮进化的模板;在短时间内完成自然界中需要成千上万年的进化,从而获得具有改进功能或全新功能的蛋白质1。
随机进化蛋白质分离纯化和结构解析的相关技术及软件的快速发展,产生了海量的蛋白质结构信息.然而截至目前,蛋白质有效突变点的预测仍然十分困难,因而随机进化(random evolution)仍是十分有效的蛋白质定向进化手段2。
(1)易错PCR技术
易错PCR是一种简便快速的在DNA序列中随机制造突变的方法, 它是通过改变传统PCR反应体系中的Mg2+浓度、dNTP的浓度比例、pH值或使用低保真度的Taq酶, 使碱基在一定程度上随机引入错误而创造序列多样性文库。这种方法对于建立任意核苷酸序列文库或是在表达及筛选过程引入突变同样有用。但是, 由于这种方法的关键在于控制合适的突变频率, 所以较低的突变率(每代每序列有2 ~ 3 个碱基置换或一个氨基酸替代)可以积累大部分的有益突变, 而较高的错掺几率将产生中性突变或有害突变。另外, 此法又是在分子内部进行的单一突变, 有害突变要比有益突变多。当一个突变体中有害突变占大多数时, 一般仅能形成无活性的蛋白分子;同样, 如果突变位点过少, 则野生型序列在整个体系中占绝对优势, 特征表现不明显, 也不利于后续的筛选和鉴定工作。
(2)定点突变和定点饱和突变技术
定点突变技术(Site-directed mutagenesis)一般用于对DNA分、子特定位点的突变, 所以需要预先知道野生型基因序列。早在1978年Michael Smith就运用寡核苷酸进行定点突变。定点突变的基本原理是首先合成一段含有突变碱基的DNA引物, 然后这段合成的引物可以杂交到包含有目的基因的单链DNA上, 用DNA聚合酶将剩余片段进行延伸, 得到的双链分子转入到宿主细胞并被克隆, 最后用特定的筛选方法将突变子筛选出来。定点突变技术有盒式诱变和多种基于PCR的突变方法, 最常见的有重叠PCR等方法。当靶位点氨基酸分别可被其它19种氨基酸代替而得到突变子的方法, 称为定点饱和突变技术, 此方法是要着重寻求靶位点的最适氨基酸。定点突变和定点饱和突变技术的运用, 能极大地丰富突变体库的多样性。
(3)组合活性中心饱和突变试验
组合活性中心饱和试验(combinatorial active-site saturation test,CAST)的基本原理是:在酶的活性中心部位寻找一系列在空间位置上相互接近的氨基酸对作为突变位点, 选择的氨基酸对必须是在侧链基团取向上具有潜在的协同作用。因此, 突变后才可能获得更具有潜力的突变体。这是单点突变不能做到的。如果选择的氨基酸对应的位置是n, 则第2个氨基酸的选择遵循以下的原则:如果第n个氨基酸在环上, 则另一个氨基酸选择第n+1 位;若在β 折叠上则选择第n+2位, 若在310螺旋上, 则选择第n+3位;若在α螺旋上, 则选择第n+4位。对于CAST突变体库容量的计算:每突变一对氨基酸要进行饱和随机突变, 即这一对氨基酸要突变成20种氨基酸的任何一种。以NNK(N代表任何一种核苷酸, K代表是G或T)作为突变的碱基形式, 则有322 =1 024种不同的组合, 而氨基酸则可突变成202 =400种不同的组合。因此, 要将每个库的所有突变的覆盖率达到95%, 则每个库至少要挑3 000个克隆子。此外, 近年来还发展出了更多的、新颖的无性突变技术。例如, 三核苷酸突变(TriNex), 随机插入-删除突变(RID), 序列饱和突变(SeSaM)以及它的改进方法SeSaM-Tv+。这些方法都是为了能最大程度的增强突变体库的多样性, 丰富并延伸无性突变的方法手段。
改组技术与随机突变相比, 改组技术可以获得更大程度的序列改变。根据不同的改组思想和不同的实验条件, 有以下几种策略可以选择3。
(1)同源改组
同源改组的典型代表是DNA Shuffling 与FamilyShuffling , 该技术利用酶或物理方法将一组带有有益突变位点的基因(或天然存在的基因家族)随机酶切成小片段, 然后进行无引物PCR 使之延长, 最后, 用基因两侧的引物合成全长基因。该技术可与随机突变技术相结合, 迅速积累有益突变, 得到最佳突变组合的酶基因。其优点是操作简单, 不必了解蛋白结构信息, 容易获得良性突变。但缺点是只能对同源性较高的一组序列进行改组(70%以上)。在此思想基础上, 还有许多改进的方法出现。例如利用随机引物扩增全长基因, 扩增过程中还可引入突变的随机引物体外重组法(random-priming invitro recombination ,RPR);利用单链DNA 作为模板的截断模板重组延伸法(Recombined extension ontruncated templates , RETT);简化实验过程, 在同一管内即可完成改组的交错延伸法(Stagger extensionprocess, StEP);利用临时模板获得高重组率的临时模板随机嵌合技术(Random chimeragenesis on transienttemplates ,RACHITT)等等。
(2)非同源改组
DNA Shuffling 对所操作基因的同源性要求较高, 而自然界中大多数同源序列的相似性达不到这么高的要求, 因此近几年发展出许多基于非同源序列的改组技术。例如渐进切割杂和酶技术(incrementaltruncation for the creation of hybrid enzymes ,ITCHY), 通过用核酸外切酶对两个亲本基因分别进行消化, 产生一系列相差单碱基的基因片断, 再将两组片断化基因互相连接, 产生杂和基因文库。该技术的优点是可以在无同源性或低同源性的两个基因间产生重组, 缺点是重组一定是在两个不同的父本之间产生, 并且子代中功能杂合子的比率很低。针对后一缺陷Sieber 等人提出非序列同源蛋白重组(sequence homology-independent protein recombination ,SHIPREC):通过琼脂糖凝胶电泳回收单基因长度随机片段, 保证了子代嵌合体长度的保守性, 使交叉点处的两个氨基酸仍处于它们在亲本蛋白质结构中的位置, 从而提高了文库中功能杂合子的比例。前一缺陷通过SCRATCHY 技术得到解决,SCRATCHY 技术是在ITCHY 和DNA 改组技术基础上发展起来的, 首先使用ITCHY 在两个低同源性基因间建立广泛的杂合基因文库, 随后该文库被作为亲本基因进行DNA 改组。其特点是不依赖基因序列的同源性而产生多个DNA 杂交位点。还有一些其他的非同源重组技术被建立, 如SCOPE (Structurebasedcombinatorial protein engineering)技术, 是一种半理性蛋白质工程技术, 可以在非同源基因间建立多位点杂交基因库, 进而筛选杂和蛋白。SISDC(Sequence-independent site-directed chimeragenesis)技术, 可以使同源性较小或没有同源性的一组蛋白基因在多个分散的位点发生重组。
(3)结构域改组
结构域改组不是以核苷酸为单位进行改组, 而是以具备相对完整性的基因片段作为改组单位。比较典型的例子是外显子改组(Exon Shuffling)。在许多真核生物基因中, 一个外显子编码一个折叠结构域, 因此可以利用内含子之间的重组使独立的外显子组装成编码新蛋白的基因。通过控制参与改组的外显子范围, 可产生不同特性的突变库, 它可以引入更多的理性设计, 因此可应用于医药等某些特殊领域。对结构域改组的深入思考可以发现, 我们甚至可以将两个功能相关的相邻基因作为两个大的结构域来进行改组, 以提高它们的协同效果。更进一步,可以对两个细胞的全基因组进行改组, 达到改变代谢途径的目的。
半理性进化尽管随机进化策略十分有效,但仍存在突变文库大、阳性突变少、难以筛选等问题.半理性进化(semi-rational evolution)策略则借助了生物信息学方法,在分析大量的蛋白质序列比对信息,二级结构数据,甚或是在同源建模得到目的蛋白三维空间构象的基础上更有针对性地对蛋白质进行改造,不但提高了阳性突变率,而且大大缩小了突变文库容量,更易于筛选.半理性进化的关键是通过计算机模拟获得潜在的有益突变位点,再利用适当的饱和突变技术构建合适的突变文库,此外,对于结构较为复杂的蛋白质,可将其分为不同的结构单元,并在其内部独立进化,组合筛选最佳进化单元,得到完整蛋白质1。
理性进化理性进化策略主要是在计算机中(in silico)完成。通过计算机建模(computational modeling)预测蛋白质活性位点,考察某基因突变对目标蛋白稳定性、折叠以及与底物结合的影响,从而对蛋白质进化进行设计指导和模拟筛选实验,提高实验的成功率。
在代谢工程中,虽然反应能垒对途径的影响十分重要,但随机进化和半理性进化策略均不能直接解决这一问题,从头设计则能够对这些因素加以考虑。从头设计首先根据量子力学建模得到目的催化反应,额外考虑某个具有高能垒的反应,推测其过渡态,定位所需的催化侧链并结合反应的优化过渡态.利用QM/MM 模型分析得到包含过渡态和涉及结合、催化的蛋白质功能团的理论蛋白质突变文库,再利用Rosetta、ORBIT、PyMol 等软件,在大量稳定的蛋白支架中搜索能够支持这些理想活性位点的蛋白质主链群,最终经过优化处理的基因序列即可进行实验验证。这种方法能够在数百个潜在的模板酶侧链中自动挑选合适的算法搜索催化侧链过渡态,并将其定位到合适位置,在一些研究中,单一蛋白质或最佳活性位点也可以进行手动选择。从头设计对于酶进化轨迹的分析有助于增强人们对蛋白质自然进化的理解,从实验中获得的反馈信息也可以更好地辅助完善理性设计。此外,利用计算机预测可以建立代谢途径、分析代谢网络,从而使用工程学方法选出重要的酶加以进化,以达到整个途径或网络的优化目的1。
应用及前景通过蛋白质的定向进化技术对蛋白进行分子改造, 极大地促进了酶工程、代谢工程以及医药等很多领域的发展, 对增强蛋白的稳定性及底物特异性、改变或增强蛋白质的活性等方面都取得了巨大的成果21。
提高酶的催化活性提高酶的催化活性是人们进行蛋白质改造最基本的愿望之一。有许多报道都证明定向进化技术对于提高酶的催化活性起到了很好的效果。Shim等采用定点突变技术构建的突变体, 改变了位于酶活性中心的“蛋白-S-结合”口袋中Met-317, 并突变为Ala, 从而有利于底物范围的扩大, 实际也证明其具有更高的催化磷酸二脂键的催化能力。淀粉蔗糖酶是一种催化蔗糖而得到的直链淀粉酶, 但是由于它直接催化蔗糖的活性较低, 使其的应用受到很大的限制。Potocki-Veronese等利用易错PCR和DNAShuffling技术对其进行突变, 得到催化蔗糖活性提高60%的突变体Asn387Asp,从而扩大其应用范围, 在实际生产中具有重要意义。
提高酶的稳定性提高或改变蛋白特性另一个重要的方面就是提高热稳定性, 因为这是在工业生产中运用酶催化反应而经常遇到的难题, 为了解决这一问题, 众多科学家采用定向进化的方法改造蛋白, 期望提高其热稳定性。Xiao等运用序列比对的结果为指导, 进行定点突变, 得到突变体的Tm值提高了6℃, 同时在不影响原有催化活性的基础上, 在45℃时的半衰期比原酶提高了23倍之多。Miyazaki等为了适应生产化需要, 综合了随机突变、定点饱和突变和DNA shuffling的方法,将11 家族木聚糖酶进行改造以提高其热稳定性。最终得到的突变体的半热变性温度从58℃提高到68℃, 最适温度也从55℃升到了65℃, 同时在60℃的热稳定性也明显增强。
另外, 蛋白经常会在有机溶剂和水-有机溶剂混合溶液中失去原有的催化活性, 所以Moore等进行了随机突变, 从枯草芽孢杆菌蛋白E的突变体库中筛选出一株能够在60%二甲基甲酰胺溶液中具有和在水溶液中相等的酶活;同样, 通过随机突变和基因重组将p-硝基苯酯酶在30%二甲基甲酰胺水溶液中的酶活提高了100倍以上。
改变酶的底物特异性Manu等通过对纤维二糖磷酸化酶(CP)进行易错PCR筛选, 得到的突变株作用底物从传统的纤维二糖转变成了乳糖, 随即提高了乳糖磷酸化酶的活性。最终得到的突变体菌株的乳糖磷酸化酶的活性比原酶高出了10倍。改变对映异构体特异性。Schmidt等选用易错PCR技术将来源于Pseudomonasfluorescens酯酶的对应选择性野生型的E值从63提高至96, 同时活性也相应的增加了, 能够达到2 min转化50%的底物, 相当于1.25 U/mg的蛋白量。Arnold等运用易错PCR和饱和诱变的方法, 成功地使一株倾向于D-型底物的乙内酰脲酶发生转变, 使之变为倾向于L-型底物, 经过分析这种转变只生发了一个氨基酸的替换。与野生型的催化蛋白相比, 增加了L-甲硫氨酸的产量, 降低了不必要的产物积累。