相似性指数分析法原理
自CramerIII在1988年创建比较分子力场分析(CoMFA)方法以来,CoMFA已经发展成为定量结构与活性相关技术(QSAR)研究中使用最广泛且最有力的工具之一,它主要用于研究分子周围的非键分子场(立体场与静电场)改变时,其相应的活性所发生的变化。1994年,Klebe等提出相似性指数分析(CoMSIA)方法,该方法是CoMFA的一种扩展,两者的原理基本相同,都基于如下假设:分子的键亲合力改变时,其相应的分子性质也发生相应变化,其分子性质以分子场的形式表现。在CoMSIA中,由于采用了与距离相关的Gaussian函数形式计算各种分子场,有效避免了分子表面附近格点上势能的显著变化以及原子位置异常的情况;另外,在CoMSIA中,也不再需要定义能量的截断值(Cut-off)。CoMSIA与CoMFA相比,其不同分子场在相应空间的贡献的相关性等值面图得到明显改善,可以更为直观的解释不同分子场对分子活性的影响。
相似性指数分析法分析过程在进行CoMSIA分析时,首先在叠合后的所有分子集合区产生边长为0.2A的格点,并用4A的边界确定所有叠合分子的区域。用CoMSIA提供的缺省探针计算分子在每个格点上的立体场、静电场、疏水场、氢键场(包括氢键受体与氢键供体)。得到每个格点的分子场后,用偏最小二乘(PartialLeastSquare,PLS)方法建立分子场参数与亲合力的定量相关模型,并用留一法(LeaveOneOut,LOO)交互校验(CrossValidation,CV)方法检验模型的统计显著性以及确定模型的主成分数,以最优的交互校验值确定的主成分数建立非交互校验的3D-QSAR模型,并以此预测测试集中化合物的亲合力1。
相似性指数分析法的应用实例利用定量结构与活性相关技术(QSAR)能够实现基于分子结构对可疑雌激素类化合物进行活性预测和筛选,然后再进行进一步生态风险评价。
三维结构-活性关系方法(3D-QSAR),如比较分子力场分析(CoMFA),通过模拟化合物与受体分子的相互作用,分析叠合分子周围三维空间内力场(立体场、静电场等)的变化来研究结构-活性关系,并能够揭示化合物生物活性的作用机制,因此在环境科学和生态毒理学等领域得到了越来越多的应用。如Tong等人和Waller用比较分子力场方法分别对不同数据集雌激素类化合物的活性进行预测,均得到了具有一定预测能力的定量模型。但这些研究主要侧重于对雌激素类化合物的活性进行预测,而对影响活性的分子结构特征,尤其从配体与受体相互作用的角度研究影响配体活性的受体结合腔中关键氨基酸残基方面并没有进行详细阐述。
相对于比较分子力场分析方法,相似性指数分析法(CoMSIA)是较晚建立的一种3D-QSAR方法。其理论基础为具有相同作用机理的系列化合物的生物活性取决于配体和受体之间非键相互作用力强弱的变化,而作用力强弱的变化来自于每个配体化合物周围分子力场的变化,与比较分子力场分析方法相比,CoMSIA方法可以同时描述分子周围立体场、静电场、疏水场、氢键供体场和氢键受体场的变化,更加全面地揭示影响生物活性的分子结构信息。
无论是CoMFA还是COMSIA方法,对所研究的化合物进行分子叠合是至关重要的一步。而雌激素类化合物来源广泛、结构复杂,因此对这类化合物(尤其对柔性分子)进行分子叠合时难以确定叠合规则。通过模拟化合物与受体分子的对接过程,确定配体在受体结合腔中的三维活性构象,以此进行分子叠合,确定分子的柔性叠合规则,然后应用比较分子相似性指数分析(CoMSIA)研究雌激素类化合物结构与活性之间的关系,建立了具有显著预测能力的雌激素类化合物活性预测模型。同时阐明了影响雌激素类化合物活性的分子结构特征,并且揭示了起关键作用的受体结合腔中的氨基酸残基以及这些氨基酸残基与配体化合物作用的具体方式。
化合物与活性数据研究对象包括雌二醇(E2)、雌酮(E1)、雌三醇(E3)及其衍生物、抗雌激素药物、植物雌激素和1,2-二苯乙烯雌激素等共44个化合物,其中37个化合物为训练集,其余7个化合物为测试集。雌激素活性指标为雌激素受体相对亲和力的对数(logRBA),活性数据及具体测定方法取自文献。
分子结构模拟第6号化合物17β-雌二醇、第38号化合物己烯雌酚(DES)、第41号化合物它莫西芬(Tamoxifen)和第44号化合物雷洛昔芬(Raloxifene)的三维结构分别取自它们与雌激素α受体(ERα)复合物的晶体结构。其他化合物的三维结构以17β-雌二醇化合物的结构为基础,采用SYBYL7。
分子模拟软件构建采用Gasteiger-Hückel方法计算原子电荷,采用Tripos标准分子力场进行优化,能量收敛标准为0.001kcal·mol-1(1cal=4.186J),得到能量最低构象。
柔性分子叠合采用SYBYL7.3软件中的Surflex-Dock程序对雌激素类化合物与雌激素α受体(ERα)进行分子对接。Surflex-Dock以CH4,C=O,N-H为分子探针,确定受体结合腔,将配体小分子与受体进行柔性对接。然后用综合考虑了极性作用、疏水作用、熵和溶剂化等因素的得分函数对配体和受体相互作用进行评分,得分最高的配体在结合腔中的构象作为该配体的最终活性构象。用Surflex-Dock分别对17β-雌二醇与受体蛋白复合物(PDBID:1ERE)和己烯雌酚(DES)与受体蛋白复合物(PDBID:3ERD)进行对接,阈值(threshold)设为0.5,膨胀系数(bload)设为1,对接后17β-雌二醇和己烯雌酚(DES)在结合腔中的位置与它们在1ERE和3ERD中的位置的均方根偏差(RMSD)分别为0.155和0.482,这说明对接非常成功。然后将其他雌激素类化合物以相同的方式分别与雌激素α受体(PDBID:1ERE)进行分子对接。分子叠合后所有雌激素类化合物用于比较分子相似性指数分析(COMSIA)。
比较分子相似性指数分析比较分子相似性指数分析(COMSIA)用来计算分子周围网格交叉点上的相似性指数。采用偏最小二乘回归分析(PLS)建立雌激素类化合物活性与结构之间的定量关系,以“逐一剔除”(LOO)和SAMPLS程序确定最佳主成分数PCs,然后再计算非交叉验证相关系数R2。用非交叉验证相关系数(R2)、标准估计误差(SEE)和F-检验值(F-test)表征模型的拟合程度。用交叉验证相关系数(Q2LOO)和标准预测误差(SEP)表征模型的稳健性。用样本外测试集相关系数(R2pred)和外部验证系数(Q2EXT)表征模型的预测能力2。