发展简介
20 世纪 90 年代以后,计算能力和分子模拟技术的高速发展使研究者能够从微观的角度认识分子之间的作用模式,以及结合过程中力和能量的变化,为高亲和性配基的筛选提供了一条新的途径。分子模拟软件融合了最先进的计算机软硬件与图形技术,集成了计算化学和分子图形学的最新成果,并将化学信息管理系统作为其贯穿整个软件的基础。它能在三维水平上了解化合物的分子结构和各种重要的微观性质(如静电势、疏水场等)与所期望的宏观性质(如亲和性)之间的定量关系。利用分子模拟软件对配基与生物大分子之间的亲和性进行预测,能够提高合成化合物的命中率,减少化合物的合成数目,双向降低合成与筛选的成本,缩短研究与开发的周期,因此具有强大的经济效益。1993 年 Lowe 等根据胰蛋白酶类似物活性部位氨基酸残基与精氨酸和赖氨酸的亲和作用,首次利用理性设计的方法对染料配基进行改造,大大提高了其亲和性。此后,越来越多的实验人员开展了应用理性设计的方法进行高亲和性配基的筛选研究。
配基的理性设计借助于计算机分子模拟技术,整合了天然蛋白质分子的特异性和合成配基在稳定性方面的各种优点,为高亲和性配基的筛选提供了一条新的思路,成为最具生命力的设计方法。理性设计亲和配基的研究历史虽然较短,但其发展对于亲和色谱技术的工业化应用有着重要的意义。目前常用的配基理性设计方法共有以下三种:基于结构的理性设计方法,基于功能的理性设计方法以及理性设计结合组合库技术的方法1。
基于结构的理性设计方法基于结构的理性设计方法是在自然界中存在的配基或目标蛋白结构的基础上,利用分子模拟软件改进或开发一种新的与目标蛋白具有更高亲和力的配基。近年来,生物信息学和计算机分子模拟技术的飞速发展为蛋白质功能和高级结构的解析提供了更为广阔的平台。截至 2008 年 7 月,已有 51, 000 个蛋白质的三维结构信息利用实验方法测得,这些信息都存储在美国 Brookheaven 构建的蛋白 质 结 构 数 据 库 ( Protein Data Bank, PDB )(http://www.rcsb.org/pdb/home/home.do)中,供全世界的研究人员免费下载。
为基于目标蛋白的三维结构,利用计算机理性设计亲和配基提供了便利,使其成为更加快速的获得高亲和性肽配基的有效方法。该方法一般包括以下步骤:
1. 通过蛋白质数据库或同源模建的方法获得目标蛋白质的相关结构信息。
2. 基于经验或分子模拟软件分析找到潜在的配基结合位点,这个位点可能是蛋白质的活性点,也可能是它的天然互补配基结合位点,或者是溶剂暴露区域等。
3. 建立一个含有大量候选分子的数据库,也可以利用商业化的数据库,如常用的剑桥结构数据库(Cambridge Structural Database,CSD)和现有化学品目录数据库(Available Chemicals Directory,ACD)等。
4. 利用分子对接软件(FlexX, Dock, Autodock 等)进行配基的筛选,获得与目标蛋白具有较高亲和性的配基。
5. 最后利用分子显示和分子性质分析软件评价所获得的配基和目标蛋白的亲和性。
利用基于结构的理性设计方法筛选亲和配基的研究已经取得了一定的研究进展。Baumann 等利用分子模拟在猪胰腺 α-淀粉酶的三维结构的基础上利用分子对接软件从含有 53 个芳基的糖类化合物中筛选出 23 个候选化合物,然后利用核磁共振技术进一步筛选获得一个与该目标蛋白具有较高亲和性的化合物,合成并固定化此肽配基制得亲和层析柱,利用同源建模的序列分析获得了人单克隆抗体片段的三维结构,然后利用分子对接软件从 ACD 数据库中筛选出 24 个化合物作为候选分子,再利用表面等离子共振和 STD-NMR 技术进一步筛选获得与目标蛋白具有高亲和性的配基,最后利用亲和色谱验证了该配基与单克隆抗体片段的亲和性。另外,如果已知待研究的目标蛋白-自然配体复合物的三维结构,也可以从已知的与待分离的生物大分子具有亲和作用力的配体小分子出发,通过结构改造、修饰等方法获得亲和力更高的配基。Platis 等以锁钥原理为基础理性设计了人艾滋病毒单克隆抗体 2F5 的亲和配基,同时利用亲和色谱实验证明了该配基与目标蛋白具有较高的亲和力1。
基于功能的理性设计方法如果待分离目标蛋白的三维结构未知或也不能通过同源建模技术获得,则可以采用基于功能的理性设计方法来设计目标蛋白的亲和配基。该方法是在自然界中存在的亲和作用体系的基础上,利用已知的配体或抑制剂的功能基团来设计新的亲和配基。利用基于功能的理性设计方法筛选肽配基有两种途径:一种途径是通过研究目标蛋白的底物、抑制剂或辅酶的形状或物理化学性质(疏水性,静电势)来设计一种与目标蛋白具有高亲和性的配基;另外一种途径是在目标蛋白的活性部位所暴露残基的基础上,根据理化性质互补的原则或引进一些特殊的功能基团来理性设计配基。因此,该方法的实质是在经验知识的基础上模仿自然界中存在的配体。例如,氨苯磷酸盐是碱性磷酸酯酶的亲和配基,而苄脒基团常被用来作为配基来分离纯化胰蛋白酶类蛋白酶,Burton 等利用该思路针对舒缓激肽设计了特异的亲和配基,利用分子模拟软件 Macromodel研究了结合于酶活性部位的二肽 Cys-Lys 与酶的相互作用模式,以 Phe-Arg 二肽为模板设计出以苯甲脒和苯丙氨酸为活性端,以三氮嗪环为母体化合物的亲和配基,其大小、形状、极性特征与模板二肽相当,能很好的结合于受体活性部位,并且结构稳定,不易降解。实验结果表明这种配基能从胰腺粗提取物中特异结合舒缓激肽而不结合胰蛋白酶和凝乳蛋白酶,其纯化倍数达到 110 倍1。
结合理性设计和组合库技术的方法与大规模的组合库筛选技术以及完全基于目标蛋白或配体的结构或功能信息和设计者经验的亲和配基设计方法相比,结合理性设计和组合库技术筛选配基已经成为一种更加高效和理性的筛选方法。它首先利用计算机的分子模拟技术获得目标蛋白或其自然配体的尽可能详尽的结构信息,把合成的注意力更多地集中在具有相关结构或化学特性的潜在配体上,以此构成一个小规模的配体库用于实验筛选,研究人员可以从中获得亲和性较高的配体;同时,通过分析筛选结果与配体结构的定性关系获得一些更为直观的经验,用于指导配体化合物的结构优化。由于单纯的规模化筛选目的性不强,筛选结果很大程度上取决于所建肽库的容量和质量;而单纯的计算机辅助的设计过程不能将随后的配基固定化过程以及复杂的化学环境、动态的结合模式等诸多可变因素考虑在内。
目标蛋白的结构和功能信息与组合配体库和高效筛选方法的结合,在很大程度上弥合了经验与实际过程之间的偏差,这种设计思路将对亲和色谱的规模化应用产生积极的影响。基于这种方法的配基筛选过程一般包括以下步骤:
1.在目标蛋白三维结构(利用 X-ray,NMR 或同源建模获得)或功能的基础上选择合适的结合位点。
2.利用分子模拟软件理性设计一些与目标蛋白结合位点的结构和物理化学性质互补的结构片段。
3.以这些结构片段为先导片段利用组合库技术(固相合成技术)来合成一系列的候选化合物。
4.以目标蛋白为靶标筛选与其具有高亲和性的配基。
5.合成该配基,固定化后制得亲和层析柱,利用其来分离目标蛋白。若其亲和分离效果不好,重复第四步进行重新筛选。
Lowe 研究组已经利用这种方法开发出一系列的三嗪类似物的配基。Roque等首先利用分子模拟工具分析了前导蛋白质L和人抗体轻链之间的相互作用,利用理性设计的方法获得了与抗体或其小片段(Fab 或 scFv)具有亲和作用的12 个先导化合物分子,然后利用固相合成技术生成一个化合物库,通过筛选获得与目标蛋白具有高亲和性的化合物。合成并固定化该化合物制得亲和层析柱,用于人免疫球蛋白 G 木瓜蛋白酶消化液中 Fab 的分离纯化,纯度达到 96~98%。Melissis 研究小组利用该技术成功地设计了与 Pfu DNA 聚合酶和 Taq DNA 聚合酶的核苷酸类似物配基,并获得了非常好的分离效果1。
理性设计提高蛋白质热稳定性的策略对蛋白质进行热稳定性改造的传统方法为定向进化,即在实验室中模拟自然界的进化过程,首先针对某一蛋白质的基因,通过特定的诱变与重组技术对其进行改造,构建突变文库,然后再根据突变体的热稳定性的状况,筛选出热稳定性较好的突变体。该方法不需要考虑蛋白质结构与功能之间的关系,但是需要构建大规模的突变体库,并且需要建立灵敏有效的高通量筛选方法,因此往往会耗费大量的人力、物力及财力。而随着人们对蛋白质结构研究的深入,大量的热稳定性蛋白质被发现以及对影响蛋白质热稳定性机制的了解,使得人们期待着采用一种理性设计的策略对蛋白质进行合理性设计而改变其热稳定性。所谓蛋白质理性设计是基于对蛋白质结构和功能关系的认识,通过定点饱和突变技术改造蛋白质的一种方法。
进行蛋白质的理性设计意味着在突变之前,人们需要进行仔细的考虑与推测,选择特定位点进行突变。该个方法通常要求有蛋白质三维结构,并且要求对蛋白质的催化机理、结构和功能的关系以及酶的热稳定性机制有深入的了解。由于人的理性参与,可以在较短的时间内设计并得到性质改善的突变体。理性设计获得的结果可以反过来扩充人们对于蛋白质结构和功能的认识。但是由于目前人们对酶的催化机制以及酶热稳定性机制的认识有限,理性设计的应用范围受到很大的限制。到现在为止应用比较成功的方法主要有以下几种2:
同源比对的策略研究发现,在嗜热蛋白质与其同源的中温蛋白质之间往往具有较高的相似性( 通常可达到40% ~ 80%) ,因此,可以通过比较热稳定性高的蛋白质与热稳定差的蛋白质的序列,找出与热稳定性相关的氨基酸位点,然后对其进行突变,进而可以提高中温蛋白质的热稳定性。其中嗜热蛋白质可以为来源于已知热稳定性质的蛋白质的同源蛋白或来源于嗜热菌基因组中编码的同源蛋白。应用同源比对策略,通过比较来源于Xanthomonas campestris 的中温果胶裂解酶( pectate lyase) 与4 条嗜热果胶裂解酶的序列,发现这4 个嗜热果胶裂解酶的序列相同,但其与中温果胶裂解酶序列不同,主要集中在9 个位点。通过将中温果胶裂解酶中的这9 个位点突变成嗜热果胶裂解酶中的氨基酸,结果显示有6 个突变体的半衰期比野生型增长,其中有一个单点突变R236F 的半衰期是野生型蛋白质的23 倍。
蛋白质表面电荷的优化策略蛋白质通常是在内部形成一个疏水核心,而在其表面分布着一些带电荷的氨基酸,这些分布在蛋白质表面的带电荷氨基酸之间可以通过电荷之间的相互作用,给蛋白质形成一个保护网,增加蛋白质对高温的抗性。因此通常可以通过对蛋白质表面带电荷的氨基酸进行重新设计优化,使其表面的电荷分布更加合理,从而提高其热稳定性。现已有研究人员设计出Modeller 软件可用于计算蛋白质表面电荷的分布状况,模拟蛋白质的结构及突变体的结构,用遗传算法来筛选最优的表面带电荷氨基酸的分布。
该软件现已应用于多种蛋白质的改良,结果发现这些表面电荷重新设计的蛋白质的热稳定性较野生型蛋白质均有一定的提高,表明该方法有一定的适用性。
基于二硫键的设计策略在蛋白质特定位置上的二硫键可以对蛋白质的热稳定性起到至关重要的作用。它主要通过降低蛋白质解折叠状态的熵值来达到稳定蛋白质结构的目的。通过认真分析二硫键中各个原子之间的距离及键角等相关信息,可知在蛋白质的二硫键中,Cβ-Sγ-Sγ之间的键角为104. 15°。利用该信息设计的二硫键设计软件( Disulfide by Design) ,可以分析蛋白质的结构中哪些氨基酸之间可能会形成二硫键,并进而通过在蛋白质的特定位置引入二硫键提高蛋白质的热稳定性。
温度因子的设计策略温度因子( B-factor) 的概念起源于晶体研究,主要是用来体现晶体中原子构象状态的一种“模糊度”( diffusion) 。这个“模糊度”实际上反映了蛋白质分子在晶体中的构象状态。B-factor 越高,“模糊度”越大,相应部位的构象就越不稳定或柔性越强。在晶体学数据中,B-factor 一般是以原子为单位给出的,通常我们将其换算成相应氨基酸残基的B-factor,从而可以分析氨基酸残基的构象稳定性或其柔性。研究发现,将蛋白质结构中B-factor 值较高的氨基酸突变后,部分突变体的热稳定性可以得到明显的提高。因此有些研究也利用机器学习算法来预测B-factor,从而辅助突变位点的设计。
SCHEMA 模拟法DNA shuffling 是一种有效的非理性设计方法,它可以将多个有益突变融合起来,形成一个更加完美实用的分子。SCHEMA 模拟法由Voigt等于2002 年提出,它的思路正是来源于这种DNA 随机重组的方法,该方法通过对蛋白质结构进行分析,将蛋白质分成若干个独立的小模块,使小模块之间的相互影响减少到最小,并利用该信息来确定蛋白质之间可以进行重组的位点。通过该方法可以将嗜热蛋白质中和嗜热相关的模块引入到中温蛋白质,进而改善蛋白质的热稳定性。该方法已成功的应用到纤维素酶的分子改良。