转录因子是一种具有特殊结构、行使调控基因表达功能的蛋白质分子,也称为反式作用因子。植物中的转录因子分为二种,一种是非特异性转录因子,它们非选择性地调控基因的转录表达,如大麦 (Hordeum vulgare) 中的HvCBF2 (C-repeat/DRE binding factor 2) (Xue et al., 2003)。还有一种称为特异型转录因子,它们能够选择性调控某种或某些基因的转录表达。典型的转录因子含有DNA结合区 (DNA-binding domain)、转录调控区 (activation domain)、寡聚化位点(oligomerization site) 以及核定位信号 (nuclear localization signal) 等功能区域。这些功能区域决定转录因子的功能和特性 (Liu et al., 1999)。DNA结合区带共性的结构主要有:1)HTH 和 HLH 结构:由两段α-螺旋夹一段β-折叠构成,α-螺旋与β-折叠之间通过β-转角或成环连接,即螺旋-转角-螺旋结构和螺旋-环-螺旋结构。2)锌指结构: 多见于 TFIII A 和类固醇激素受体中,由一段富含半胱氨酸的多肽链构成。每四个半光氨酸残基或组氨酸残基螯合一分子 Zn2+ ,其余约 12-13 个残基则呈指样突出,刚好能嵌入 DNA 双螺旋的大沟中而与之相结合。3)亮氨酸拉链结构:多见于真核生物 DNA 结合蛋白的 C 端,与癌基因表达调控有关。由两段α - 螺旋平行排列构成,其α - 螺旋中存在每隔 7 个残基规律性排列的亮氨酸残基,亮氨酸侧链交替排列而呈拉链状,两条肽链呈钳状与 DNA 相结合。
同一家族的转录因子之间的区别主要在转录调控区。转录调控区包括转录激活区 (transcription activation domain) 和转录抑制区 (transcription repression domain) 二种。近年来,转录的激活区被深入研究。它们一般包含DNA结合区之外的30-100个氨基酸残基,有时一个转录因子包含不止一个转录激活区。如控制植物储藏蛋白基因表达的VP1和PvALF转录因子,它们的N-末端酸性氨基酸保守序列都具有转录激活能力,与酵母转录因子GCN4和病毒转录因子的VP16的酸性氨基酸转录激活区有较高同源性 (Bobb et al., 1996)。典型的植物转录因子激活区一般富含酸性氨基酸、脯氨酸或谷氨酰胺等,如GBF (G-box binding factor) 含有的GCB盒 (GBF conserved box) 激活结构域 (lunwen114 and Bevan, 1998)。
转录抑制区也是转录因子调控表达的重要位点,但是对其作用机理研究尚不深入。可能的作用方式有三种:1)与启动子的调控位点结合,阻止其它转录因子的结合;2)作用于其它转录因子,抑制其它因子的作用;3)通过改变DNA的高级结构阻止转录的发生。
转录因子必须在核内作用,才能起到调控表达的目的。因此,转录因子上的核定位序列是其重要的组成部分。一般一个或多个核定位序列在转录因子中不规则分布,同时也存在不含核定位序列的转录因子,它们通过结合到其它转录因子上进入细胞核。核定位序列一般是转录因子中富含精氨酸和赖氨酸残基的区段。目前,水稻中的GT-2、西红柿中的HSFA1-2、玉米的O2和碗豆的PS-IAA4和6等转录因子中的核定位序列都已被鉴定 (Boulikas, 1994; Dehesh et al., 1995; Lyck et al., 1997; Varagona et al., 1992; Abel and Theologis, 1995)。
绝大多数转录因子结合 DNA前需通过蛋白质-蛋白质相互作用形成二聚体或多聚体。所谓二聚体化就是指两分子单体通过一定的结构域结合成二聚体,它是转录因子结合DNA时最常见的形式。由同种分子形成的二聚体称同二聚体,异种分子间形成的二聚体称异二聚体。这种多聚体的形成是转录因子上的寡聚化位点 (oligomerization site) 相互作用的结果,寡聚化位点的氨基酸序列很保守,大多与DNA结合区相连并形成一定的空间构象。除二聚化或多聚化反应,还有一些调节蛋白不能直接结合DNA,而是通过蛋白质-蛋白质相互作用间接结合DNA,调节基因转录,这样就形成了一个表达调控的复合物。
转录因子的作用是通过和顺式因子的互作来实现的。这段序列可以和转录因子的DNA结合域实现共价结合,从而对基因的表达起抑制或增强的作用。