在生物体内,生物信息的流动可以分为两个部分:第一部分是存储于DNA序列中的遗传信息通过转录和翻译传入蛋白质的一级序列中,这是一维信息之间的传递,三联子密码介导了这一传递过程;第二部分是肽链经过疏水塌缩、空间盘曲、侧链聚集等折叠过程形成蛋白质的天然构象,同时获得生物活性,从而将生命信息表达出来;而蛋白质作为生命信息的表达载体,它折叠所形成的特定空间结构是其具有生物学功能的基础,也就是说,这个一维信息向三维信息的转化过程是表现生命活力所必需的。 自从20世纪60年代,Anfinsen基于还原变性的牛胰RNase在不需其他任何物质帮助下,仅通过去除变性剂和还原剂就使其恢复天然结构的实验结果,提出了“多肽链的氨基酸序列包含了形成其热力学上稳定的天然构象所必需的全部信息”的“自组装学说”以来,随着对蛋白质折叠研究的广泛开展,人们对蛋白质折叠理论有了进一步的补充和扩展。Anfinsen的“自组装热力学假说”得到了许多体外实验的证明,的确有许多蛋白在体外可进行可逆的变性和复性,尤其是一些小分子量的蛋白,但是并非所有的蛋白都如此。而且由于特殊的环境因素,体内蛋白质的折叠远非如此。 体内蛋白质的折叠往往需要有其他辅助因子的参与,并伴随有ATP的水解。因此,Ellis 于1987年提出了蛋白质折叠的“辅助性组装学说”。这表明蛋白质的折叠不仅仅是一个热力学的过程,显然也受到动力学的控制。有的学者基于有些相似氨基酸序列的蛋白质具有不同的折叠结构,而另外一些不同氨基酸序列的蛋白质在结构上却相似的现象,提出了mRNA二级结构可能作为一种遗传密码从而影响蛋白质结构的假说。但目前为止,该假说尚没有任何实验证据,只有一些纯数学论证[3]。那么,蛋白质的氨基酸序列究竟是如何确定其空间构象的呢?围绕这一问题科研人员已进行了大量出色的工作,但迄今为止我们对蛋白质的折叠机制的认识仍是不完整的,甚至有些方面还存在着错误的观点。 在这方面作出重要贡献的典型研究实例是美国C.B.安芬森小组关于牛胰核糖核酸酶的变性和复性的研究。牛胰核糖核酸酶含有124个氨基酸残基,由8个巯基配对组成4对二硫键。可以计算出酶分子中8个巯基组成4对二硫键的可能方式有105种,这就提供了一个定量估算复性重组的指标。在温和的碱性条件下,8摩尔的浓脲和大量巯基乙醇能使四对二硫键完全还原,整个分子变为无规则卷曲状,酶分子变性。透析去除脲,在氧的存在下,二硫键重新形成,酶分子完全复性,二硫键中成对的巯基都与天然一样,复性分子可以结晶且具有与天然酶晶体相同的X射线衍射花样,从而证实,酶分子在复性过程中,不仅能自发地重新折叠,而且只选择了105种二硫键可能配对方式中的一种。
蛋白质折叠机制的理论模型
框架模型
(Framework Model) 框架模型[4] 假设蛋白质的局部构象依赖于局部的氨基酸序列。在多肽链折叠过程的起始阶段, 先迅速形成不稳定的二级结构单元; 称为“flickering cluster”, 随后这些二级结构靠近接触, 从而形成稳定的二级结构框架;最后,二级结构框架相互拼接,肽链逐渐紧缩,形成了蛋白质的三级结构。这个模型认为即使是一个小分子的蛋白也可以一部分一部分的进行折叠, 其间形成的亚结构域是折叠中间体的重要结构。
疏水塌缩模型
(Hydrophobic Collapse Model) 在疏水塌缩模型[5]中,疏水作用力被认为是在蛋白质折叠过程中起决定性作用的力的因素。在形成任何二级结构和三级结构之前首先发生很快的非特异性的疏水塌缩。
扩散-碰撞-粘合机制
(Diffusion-Collision-Adhesion Model) 该模型认为蛋白质的折叠起始于伸展肽链上的几个位点,在这些位点上生成不稳定的二级结构单元或者疏水簇,主要依靠局部序列的进程或中程(3-4个残基)相互作用来维系。它们以非特异性布朗运动的方式扩散、碰撞、相互黏附,导致大的结构生成并因此而增加了稳定性。进一步的碰撞形成具有疏水核心和二级结构的类熔球态中间体的球状结构。球形中间体调整为致密的、无活性的类似天然结构的高度有序熔球态结构。最后无活性的高度有序熔球态转变为完整的有活力的天然态。
成核-凝聚-生长模型
(Nuclear-Condensation-Growth Model) 根据这种模型,肽链中的某一区域可以形成“折叠晶核”,以它们为核心,整个肽链继续折叠进而获得天然构象。所谓“晶核”实际上是由一些特殊的氨基酸残基形成的类似于天然态相互作用的网络结构,这些残基间不是以非特异的疏水作用维系的,而是由特异的相互作用使这些残基形成了紧密堆积。晶核的形成是折叠起始阶段限速步骤。
拼版模型
(Jig-Saw Puzzle Model) 此模型[9]的中心思想就是多肽链可以沿多条不同的途径进行折叠, 在沿每条途径折叠的过程中都是天然结构越来越多, 最终都能形成天然构象, 而且沿每条途径的折叠速度都较快, 与单一途径折叠方式相比, 多肽链速度较快, 另一方面, 外界生理生化环境的微小变化或突变等因素可能会给单一折叠途径造成较大的影响,而对具有多条途径的折叠方式而言, 这些变化可能给某条折叠途径带来影响, 但不会影响另外的折叠途径, 因而不会从总体上干扰多肽链的折叠, 除非这些因素造成的变化太大以致于从根本上影响多肽链的折叠。
格点模型??
格点模型(也简称HP模型),最早是由Dill等人1989年提出的。格点模型可分为二维模型和三维模型两类。二维格点模型就是在平面空间中产生正交的单位长度的网格,每个氨基酸分子按在序列中排序的先后顺序依次放置到这些网格交叉点上,在序列中相邻的氨基酸分子放置在格点中时也必须相邻,即相邻氨基酸分子在格点模型中的距离为1。但是需要注意的是,网格中的每个交叉点最多只能放置一个氨基酸分子,如果序列中的某个氨基酸分子已经放置在此位置上,则后序的氨基酸分子就不可以再放置在这个格点上。如果在放置氨基酸分子的过程中出现当前所要放置的氨基酸分子没有位置可以放置了,那就说明该构型是不合理的,需要重新放置。三维格点模型和二维格点模型相似,它是在三维空间中产生的单位长度的立体网格。格点中放置氨基酸分子的方法和二维的相同,但在二维格点模型中放置氨基酸分子时除了序列前两个氨基酸分子外最多只有三个方向可以选择,而在三维格点模型中复杂度提高了很多,放置氨基酸分子最多可以有五个方向可选。
分子伴侣
1978 年,Laskey 在进行组蛋白和DNA 在体外生理离子强度实验时发现,必须要有一种细胞核内的酸性蛋白———核质素(nucleoplasmin) 存在时,二者才能组装成核小体,否则就发生沉淀。据此Laskey 称它为“分子伴侣”。分子伴侣是指能够结合和稳定另外一种蛋白质的不稳定构象,并能通过有控制的结合和释放,促进新生多肽链的折叠、多聚体的装配或降解及细胞器蛋白的跨膜运输的一类蛋白质 [10,11] 。分子伴侣是从功能上定义的,凡具有这种功能的蛋白质都是分子伴侣,它们的结构可以完全不同。这一概念目前已延伸到许多蛋白质,现已鉴定出来的分子伴侣主要属于三类高度保守的蛋白质家族[12]:stress 90 family、stress 70 family、stress 60 family。其中stress 60 family存在于真核生物的线粒体(在哺乳动物中称为Hsp58)、叶绿体(称为cpn60)中,在原核生物的细胞质中,它被称为GroEL。
意义
蛋白质折叠机制的阐明将揭示生命体内的第二套遗传密码,这是它的理论意义。蛋白质折叠的研究,比较狭义的定义就是研究蛋白质特定三维空间结构形成的规律、稳定性和与其生物活性的关系。在概念上有热力学的问题和动力学的问题;蛋白质在体外折叠和在细胞内折叠的问题;有理论研究和实验研究的问题。这里最根本的科学问题就是多肽链的一级结构到底如何决定它的空间结构?既然前者决定后者,一级结构和空间结构之间肯定存在某种确定的关系,这是否也像核苷酸通过“三联密码”决定氨基酸顺序那样有一套密码呢?有人把这设想的一级结构决定空间结构的密码叫作“第二遗传密码”。 如果说“三联密码”已被破译而实际上已成为明码,那么破译“第二遗传密码”正是“蛋白质结构预测”从理论上最直接地去解决蛋白质的折叠问题,这是蛋白质研究最后几个尚未揭示的奥秘之一。“蛋白质结构预测”属于理论方面的热力学问题。就是根据测得的蛋白质的一级序列预测由Anfinsen原理决定的特定的空间结构。蛋白质氨基酸序列,特别是编码蛋白质的核苷酸序列的测定现在几乎已经成为常规技术,从互补DNA(cDNA)序列可以根据“三联密码”推定氨基酸序列,这些在上一世纪获得重大突破的分子生物学技术,大大加速了蛋白质一级结构的测定。目前蛋白质数据库中已经存有大约17万个蛋白的一级结构,但是测定了空间结构的蛋白大约只有1.2万个,这中间有许多是很相似的同源蛋白,而真正不同的蛋白只有1000多个。随着人类基因组计划的胜利完成,解读了人类DNA的全序列,蛋白质一级结构的数据增长必定会出现爆炸的态势,而空间结构测定的速度远远滞后,因此二者之间还会形成更大的距离,这就更需要进行蛋白质结构的预测。
前景
同时,它还存在重要的潜在应用前景,例如以下几个方面:
包涵体复性
▲利用DNA重组技术可以将外源基因导入宿主细胞。但重组基因的表达产物往往形成无活性的、不溶解的包涵体。折叠机制的阐明对包涵体的复性会有重要帮助。
人工设计蛋白质
▲DNA重组和多肽合成技术的发展使我们能够按照自己的意愿设计较长的多肽链。但由于我们无法了解这一多肽将折叠为何种构象,从而无法按照自己意愿设计我们需要的、具有特定功能的蛋白质。
寻找致病机理
▲许多疾病,如阿兹海默症(Alzheimer's),疯牛病(Mad Cow, BSE),可传播性海绵状脑病(CJD),肌萎缩性脊髓侧索硬化症(ALS),还有帕金森氏症(Parkinson's)等正是由于一些细胞内的重要蛋白发生突变,导致蛋白质聚沉或错误折叠而造成的。因此,深入了解蛋白质折叠与错误折叠的关系对于这些疾病的致病机制的阐明以及治疗方法的寻找将大有帮助。
揭示蛋白质功能
▲基因组序列的发展使我们得到了大量的蛋白质序列,结构信息的获得对于揭示它们的生物学功能是十分重要的。依靠现有手段(X-ray晶体衍射、NMR及电镜)测定蛋白质的结构需要较长的时间,因此结构解析的步伐已落后于发现新蛋白的步伐。而结构预测的方法虽然速度较快,但可靠性并不高,只有当我们对于维持蛋白质结构,驱动蛋白质折叠的理化因素更为了解,这一方法才可能有根本的改进。另外,我们对于蛋白质相互作用、配体与蛋白质的作用等结构与功能关系的研究也有赖于蛋白质折叠机制的阐明。
蛋白质折叠与“折叠病”
人们对由于基因突变造成蛋白质分子中仅仅一个氨基酸残基的变化就引起疾病的情况已有所了解,即所谓“分子病”,如地中海镰刀状红血球贫血症就是因为血红蛋白分子中第六位的谷氨酸突变成了颉氨酸。现在则发现蛋白质分子的氨基酸序列没有改变,只是其结构或者说构象有所改变也能引起疾病,那就是所谓“构象病”,或称“折叠病”。 大家都知道的疯牛病,它是由一种称为Prion的蛋白质的感染引起的,这种蛋白质也可以感染人而引起神经系统疾病。在正常机体中,Prion是正常神经活动所需要的蛋白质,而致病Prion与正常Prion的一级结构完全相同,只是空间结构不同。这一疾病的研究涉及到许多生物学的基本问题。一级结构完全相同的蛋白质为什么会有不同的空间结构,这与Anfinsen原理是否矛盾?显然这里有蛋白质的能量和稳定性问题。 从来认为蛋白结构的变化来自于序列的变化,而序列的变化来自于基因的变化,生命信息从核酸传递到蛋白。而致病Prion的信息已被诺贝尔奖获得者普鲁辛纳证明不是来自基因的变化,致病蛋白Prion导致正常蛋白Prion转变为致病的折叠状态是通过蛋白分子间的作用而感染!这种相互作用的本质和机制是什么?仅仅改变了折叠状态的分子又如何导致严重的疾病?这些问题都不能用传统的概念给予满意的解释,因此在科学界引起激烈的争论,有关研究的强度和竞争性也随之大大增强。 由于蛋白质折叠异常而造成分子聚集甚至沉淀或不能正常转运到位所引起的疾病还有老年性痴呆症、囊性纤维病变、家族性高胆固醇症、家族性淀粉样蛋白症、某些肿瘤、白内障等等。由于分子伴侣在蛋白质折叠中至关重要的作用,分子伴侣本身的突变显然会引起蛋白质折叠异常而引起折叠病。随着蛋白质折叠研究的深入,人们会发现更多疾病的真正病因和更针对性的治疗方法,设计更有效的药物。现在发现有些小分子可以穿越细胞作为配体与突变蛋白结合,从而使原已失去作战能力的突变蛋白逃逸“蛋白质质量控制系统”而“带伤作战”。这种小分子被称为“药物分子伴侣”,有希望成为治疗“折叠病”的新药。 新生肽的折叠问题或蛋白质折叠问题不仅具有重大的科学意义,除了上面提到的在医学上的应用价值外,在生物工程上具有极大的应用价值。基因工程和蛋白工程已经逐渐发展成为产值以数十亿美元计的大产业,进入21世纪后,还将会有更大的发展。但是当前经常遇到的困难,是在简单的微生物细胞内引入异体DNA后所合成的多肽链往往不能正确折叠成为有生物活性的蛋白质而形成不溶解的包含体或被降解。这一“瓶颈”问题的彻底解决有待于对新生肽链折叠更多的认识。