比较建模法预测蛋白质的结构
按照目前的定义,若待模型构建蛋白质的序列与模板序列经比对(alignment)后的序列同源性(sequence identity)在40%(也有人认为在35%)以上,则它们的结构可能属于同一家族,它们是同源蛋白(homology)可以用同源蛋白模型构建的方法预测其三维结构。因为它们可能是由同一种蛋白质分化而来,具有相似的空间结构及相同或相近的功能。因此,若知道了同源蛋白家族中某些蛋白质的结构,就可以预测其他一些序列已知而结构未知的同源蛋白的结构,可以用同源模型构建的方法预测未知蛋白质的三维结构。同源蛋白模型构建的步骤如下。
(一)目标蛋白序列与目标序列的匹配
应用FASTA或BLAST搜索软件,在PIR、SWISSPROT或GENEBANK等序列库中按序列同源性挑选出一些同源性比较高的序列,然后把挑选出的序列与目标序列基序多重匹配,得到模板结构等价位点套的初始集合。
(二)根据模板结构构建目标蛋白结构模型
在已确定的模板结构等价位点套的初始集合的基础上,旋转每一个模板的结构,使它们相互间的未知尽可能多地重叠在一起。不同两个模板在空间中若复合一定的重叠距离标准,那它们相互之间的关系就是等价位点。许多这样的等价位点构成了等价位点套。
叠合结束后,即得到了同源蛋白的结构保守区(SCR),以及相应的基架结构(f
(三)对模型构建结构基序的优化和评估
同源结构模型构建(预测)得到的蛋白质结构模型,通常含有一些不合理的原子间接触,须对模型进行分子力学和分子动力学优化,消除模型中不合理的接触。另外,模型中有些键长、键角和两面角也有可能不合理,也须检查评估。PROCHECK和PROSAⅡ等软件常用于完成这类工作