分子生物学近十年来会有哪些重要突破?

2025-01-05 08:46:03
推荐回答(1个)
回答1:

原定2005年完成人类基因组DNA测序的计划,已提前5年完成。当前,人类基因组研究的重点正在由“结构”向功能转移,一个以基因组功能研究为主要研究内容的“后基因组”(post-genomics)时代已经到来。它的主要任务是研究细胞全部基因的表达图式和全部蛋白图式,或者说“从基因组到蛋白质组”。于是,分子生物学研究的重点似乎又将回到蛋白质上来,生物信息学也应运而生。随着新世纪的到来,生命科学又将进入这样一个新时代。

一、功能基因组学
遗传学最近的定义是,对生物遗传的研究和对基因的研究。功能基因组学(functionalgenomics)是依附于对DNA序列的了解,应用基因组学的知识和工具去了解影响发育和整个生物体的特定序列表达谱。以酿酒酵母(S.cervisiae)为例,它的16条染色体的全部序列已于1996年完成,基因组全长12086 kb,含有5885个可能编码蛋白质的基因,140个编码rRNA基因,40个编码snRNA基因和275个tRNA基因,共计6340个基因。功能基因组学是进一步研究这6000多个基因,在一定条件下,譬如酵母孢子形成期,同时有多少基因协同表达才能完成这一发育过程,这就需要适应这一时期的全套基因表达谱(gene expression pattern)。要解决如此复杂的问题就必须在方法学上有重大的突破,创造出高效快速地同时测定基因组成千上万个基因活动的方法。目前用于检测分化细胞基因表达谱的方法,有基因表达连续分析法(serial analysis Of gene expression,SAGE)、微阵列法(microarray)、有序差异显示(ordered differential display,ODD)和DNA芯片(DNA chips)技术等。今后,随着功能基因组学的深入发展,将会有更新更好的方法和技术出现。
功能基因组亦包括了在测序后对基因功能的研究。酵母有许多功能重复的基因,常分布在染色体的两端,当酵母处于丰富培养基条件时,这些基因似乎是多余的,但环境改变时就显示出其功能。基因丰余现象实际上是对环境的适应,丰余基因的存在为进化适应提供了可选择的余地。基因组全序列还保留了基因组进化的遗迹,提示基因重复常发生在近中心粒区和染色体臂中段。
当前,研究者已把酵母基因组作为研究真核生物基因组功能的模式,计划建立酵母基因组6000多个基因的单突变体文库(single mutant library),并可用于其它高等真核生物基因组之“基因功能作图”。
总之,功能基因组学的任务,是对成千上万的基因表达进行分析和比较,从基因组整体水平上阐述基因活动的规律。核心问题是基因组的多样性和进化规律,基因组的表达及其调控,模式生物体基因组研究等。这门新学科的形成,是在后基因组时代生物学家的研究重点从揭示生命的所有遗传信息转移到在整体水平上对生物功能研究的重要标志。

二、蛋白质组学
蛋白质组(proteome)对不少人来说,目前还是一个比较陌生的术语;它是在1994年由澳大利亚Macguarie大学的Wilkins等首先提出的,随后,得到国际生物学界的广泛承认。他们对蛋白质组的定义为:“蛋白质组指的是一个基因组所表达的全部蛋白质”(proteome indicates the proteins expressed by a genome);“proteome”是由蛋白质一词的前几个字母"prote”和基因组一词的后几个字母"ome”拼接而成。
蛋白质组学是以蛋白质组为研究对象,研究细胞内所有蛋白质及其动态变化规律的科学。蛋白质组与基因组不同,基因组基本上是固定不变的,即同一生物不同细胞中基因组基本上是一样的,人类的基因总数约是6~10万个。单从DNA序列尚不能回答某基因的表达时间、表达量、蛋白质翻译后加工和修饰的情况,以及它们的亚细胞分布等。这些问题可望在蛋白质组研究中找到答案,因为蛋白质组是动态的,有它的时空性、可调节性,进而能够在细胞和生命有机体的整体水平上阐明生命现象的本质和活动规律。蛋白质组研究的数据与基因组数据的整合,亦会对功能基因组的研究发挥重要的作用。
蛋白质组由原定义一个基因组所表达的蛋白质,改为细胞内的全部蛋白质,比较更为全面而准确。但是,要获得如此完整的蛋白质组,在实践中是难以办到的。因为蛋白质的种类和形态总是处在一个新陈代谢的动态过程中,随时发生着变化,难以测准。所以,1997年,Cordwell和Humphery-Smith提出了功能蛋白质组(functional proteome)的概念,它指的是在特定时间、特定环境和实验条件下基因组活跃表达的蛋白质。与此同时,中国生物科学家提出了功能蛋白质组学(functional protemics)新概念,把研究定位在细胞内与某种功能有关或在某种条件下的一群蛋白质。功能蛋白质组只是总蛋白质组的一部分,通过对功能蛋白质组的研究,既能阐明某一群体蛋白质的功能,亦能丰富总蛋白质数据库,是从生物大分子(蛋白质、基因)水平到细胞水平研究的重要桥梁环节。
无论是蛋白质组学还是功能蛋白质组学,首先都要求分离亚细胞结构、细胞或组织等不同生命结构层次的蛋白质,获得蛋白质谱。为了尽可能分辨细胞或组织内所有蛋白质,目前一般采用高分辨率的双向凝胶电泳。一种正常细胞的双向电泳图谱通过扫描仪扫描并数字化,运用二维分析软件可对数字化的图谱进行各种图像分析,包括分离蛋白在图谱上的定位,分离蛋白的计数、图谱间蛋白质差异表达的检测等。一种细胞或组织的蛋白质组双向电泳图,可得到几千甚至上万种蛋白质,为了适应这种大规模的蛋白质分析,质谱已成为蛋白质鉴定的核心技术。从质谱技术测得完整蛋白质的相对分子质量、肽质谱(或称肽质量指纹,pepetide massfingerprint)以及部分肽序列等数据,通过相应数据库的搜寻来鉴定蛋白质。此外,尚需对蛋白质翻译后修饰的类型和程度进行分析。在蛋白质组定性和定量分析的基础上建立蛋白质组数据库。
从提出蛋白质组的概念到现在短短几年中,已于1997年构建成第一个完整的蛋白质组数据库-酵母蛋白质数据库(yeast protein database,YPD),进展速度极快,新的思路和技术不断涌现,蛋白质组学这门新兴学科,在今后的实践中将会不断完善,充实壮大,发展成为后基因组时代的带头学科。

三、生物信息学
HGP大量序列信息的积累,导致了生物信息学(Bioinformatics)这门全新的学科的产生,对DNA和蛋白质序列资料中各种类型信息进行识别、存储、分析、模拟和转输。它常由数据库、计算机网络和应用软件三大部分组成。国际上现有4个大的生物信息中心,即美国生物工程信息中心(GenBank)和基因组序列数据库(GSDB),欧洲分子生物学研究所(EMBL)和日本DNA数据库(DDBJ)。这些中心和全球的基因组研究实验室通过网站、电子邮件或者直接与服务器和数据库联系而获得的搜寻系统,使得研究者可以在多种不同的分析系统中对序列数据进行查询,利用和共享巨大的生物信息资源。
随着DNA大规模自动测序的迅猛发展,序列数据爆炸性地积累,HGP正式启动之时,就与信息科学和数据库技术同步发展,收集、存储、处理了庞大的数据,生物信息学逐步走向成熟,在基因组计划中发挥了不可取代的作用。建立的核苷酸数据库,已存有数百种生物的cDNA和基因组DNA序列的信息。在已应用的软件中,有DNA分析、基因图谱构建、RNA分析、多序列比较、同源序列检索、三维结构观察与演示、进化树生成与分析等。在蛋白质组计划中,由于蛋白质组随发育阶段和所处环境而变化,mRNA丰度与蛋白质的丰度不是显著相关,以及需要经受翻译后的修饰,因而对蛋白质的生物信息学研究,在内容上有许多特殊之处。现在建立的数据库,有蛋白质序列、蛋白质域、二维电泳、三维结构、翻译后修饰、代谢及相互作用等。而通用的软件,主要包括蛋白质质量+蛋白质序列标记、模拟酶解、翻译后修饰等。
当今的潮流是利用生物信息学研究基因产物-蛋白质的性质并估计基因的功能。传统的基因组分析是利用一系列方法来得到连续的DNA序列的信息,而蛋白质组连续系(proteomic cortigs)则源于多重相对分子质量和等电范围,由此来构建活细胞内全部蛋白质表达的图像。氨基酸序列与其基因的DNA序列将被联系在一起,最终与蛋白质组联系在一起,从而允许人们研究不同条件下的细胞和组织