讲起来很复杂哈,简单来说,就是边合成边测序,把所要测序的序列通过各种手段来建库,然后加上5‘和3’都加上接头,放在一个小玻璃片一样的芯片上,上面一般是8个lane,把样品加入到lane上之后和上面长好的接头序列相结合(之前的建库时加的接头与之反向互补),然后再经过PCR扩增的过程形成一个DNA簇,然后再进行新一条链的合成,在此合成过程中边合成边测序,没加上去一个碱基,机器就读一次,根据其发到荧光来判断加的是那种碱基,这样就能得到所要的序列信息了。
测序会有误差的,就好比PCR扩增循环多了也会有误差一样,假如说在第一百个碱基合成时其误差是99.9%,那下一个的误差就是99.9%*99.9%.....依次以指数形式递增,到一定程度后测得的序列就不可靠了,所以会有一个极限,现在solexa的极限貌似比之前的150bp要长了。
当然以上都是指的Solexa的平台,454是焦磷酸测序原理,就又是一种方式了,这种方法得到的可靠序列长度之前说是500bp以上,现在估计都能测通1000bp了。
比较常用的鸟枪法是先将基因组用酶切打断成很多的碎片,之所以这么操纵是因为目前的测序只能测小片段,而不能测大片段。
把这么多的小片段测完后所面临的一个问题是组装,因为片段与片段之间存在着重叠,根据这些重叠就可以确定这些片段的先后顺序(当然说起来好像很简单,但是实际操纵起来非常复杂,因为基因组上有很多的重复序列,会使得片段与片段之间有很多组装的可能性,这个时候还需要借助一些数学的算法)
基本过程就是这样。目前基因组测序比20年前人类基因组刚起步时已经有了长足的进展,越来越多的先进测序技术得以发展。
具体的可以参考一下朱玉贤主编的现代分子生物学