一段基因长这样:
...XXX-exon-intron-exon-intron-exon-intron-exon-XXX...
从上面转录出的非成熟mRNA长这样:
exon-intron-exon-intron-exon-intron-exon
经过剪切之后的成熟mRNA长这样:
exon-exon-exon-exon
这段mRNA的所有exon连起来,等价于:
5'UTR-CDS-CDS-CDS-3'UTR
之所以写成多个CDS,是因为完整的CDS在最上面的基因序列中会被exon分割成几段。
换句话说,一段exon可能只包含UTR,可能只包含CDS,也可能两者都包括。