Please wait a minute...
图/表 详细信息
植物基因表达调控与进化机制研究进展
王子韵, 吕燕文, 肖钰, 吴超, 胡新生
植物学报    2025, 60 (4): 621-639.   DOI: 10.11983/CBB24175
摘要   (529 HTML5 PDF(pc) (596KB)(1837)  

功能基因表达是连接基因编码信息与蛋白质产物的一个基本生命过程, 基因表达水平被视为介于基因型与表现型之间的一种数量性状, 在植物应对气候和环境变化时发挥重要作用。该文首先系统综述了植物基因表达调控因子研究进展, 包括转录因子和小RNA等在基因表达调控中的作用。其次, 探讨了基于基因表达数据进行全基因组关联分析(GWAS)估计调控因子基因的表达数量性状基因座(eQTLs)位置以及该方法的局限性。随后从理论上分析了在突变、漂变、选择和迁移过程中的种内基因表达变异与检验方法, 在突变-漂变过程中以及在基于系统发育树的漂变-选择过程中的种间基因表达进化与检测方法。最后, 探讨了植物交配系统对基因表达进化的调控, 自交降低了有效群体大小、突变率、基因重组及外源花粉竞争, 改变了配子与合子阶段的自然选择功效等, 从而间接调控种内基因表达变异和种间基因表达进化。全文综合评述了目前的理论和实际研究进展及存在的问题, 有助于深入理解植物基因表达调控和进化机制。


检测方法 假设 参考文献
种内变异-种间分化比较
(纯突变过程)
H0: 种间基因表达进化等于种内基因表达变异
H1: 稳定选择或歧化选择
Oleksiak et al., 2002; Rifkin et al., 2003; Khaitovich et al., 2004; Lemos et al., 2005; Gilad et al., 2006
基于系统发育树
(考虑种间基因表达均值变异)
H0: 种间基因表达进化遵循BM (Brownian-motion)过程, 类似于漂变过程; 只考虑基因表达均值特征
H1: 种间基因表达进化遵循OU (Ornstein-Uhlenbeck)过程, 受稳定选择或定向选择
Butler and King, 2004; Bedford and Hartl, 2009; Gu, 2010
基于系统发育树
(考虑种内和种间基因表达变异)
H0: 种内和种间基因表达进化遵循OU过程, 受稳定选择
H1: 种内和种间基因表达进化遵循OU过程, 受定向选择
Rohlfs and Nielsen, 2015
View table in article
表2 基于种间基因表达进化的选择检验
正文中引用本图/表的段落
长链非编码RNA是一类长度超过200 bp的非编码RNA分子, 其在转录、转录后和翻译水平等阶段调控植物基因表达。环状RNA (circRNA)属于一类特殊的lncRNA。lncRNA通过与DNA、RNA或蛋白质相互作用, 在转录水平上调控基因表达。在小麦(Triticum aestivum)中, lncRNA GARR2能够调控与赤霉素和生长素相关的差异表达基因, 从而影响小麦的株高和叶鞘长度等性状(胡卫国, 2020)。在白桦(Betula platyphylla)中, lncW20通过结合BpPOD59BpCYP76G1基因的启动子, 上调其表达水平, 提高植物的抗氧化能力, 从而增强抗旱性(赵慧敏, 2022)。
基因表达水平可以用绝对和相对表达量来表示, 前者指在特定条件下, 基因的表达量可以被直接量化为一个具体的数值, 这种方法通常需要使用标准样品或已知浓度的样品做参考(Bustin, 2000; Eppler et al., 2005), 实验要求较高, 步骤较烦琐。后者则是通过比较目标RNA分子在不同样品或不同条件下的表达水平变化来估计其相对表达量(Fleige et al., 2006), 这种方法通常选择1个或多个内参基因作为对照, 以校正样品间的差异。衡量基因相对表达量常用的方法有2-ΔΔCT法(Livak and Schmittgen, 2001)和Pfaffl法(Pfaffl, 2001)。应用RNA-seq分析时, 同时测定多基因表达水平, 为消除基因长度和测序深度对基因表达水平的影响, 需将数据进行归一化处理(Evans et al., 2018), 常用RPKM (reads per kilobase per million)、FPKM (fragments per kilobase per million) (Mortazavi et al., 2008)以及TPM (transcripts per million)表示(Wagner et al., 2012)。
基因表达在生态与进化生物学方面有广泛应用。例如, Palma-Silva等(2024)利用基因表达评价竹芋科细穗竹芋属植物Ischnosiphon colombianus在亚马逊河岸森林系统中对2种环境的响应, 认为不同环境条件和洪涝灾害是种群遗传分化的驱动因素。Andrew等(2024)研究了澳大利亚17个相思树属(Acacia)树种响应热胁迫后的基因表达与环境关联性。基因表达测定也常用于分析特定基因在植物不同组织器官中的表达定位, 以及比较物种间或不同环境条件下的基因表达模式差异等(Wu et al., 2024), 依据统计学检验筛选表达差异显著的基因并进行注释, 但这类研究一般不探究基因表达调控因子。
目前已有一些方法检测种间基因表达进化是否受自然选择影响(表2)。
(3) 在上述OU模型基础上, 同时考虑种内基因表达方差和种间基因表达进化方差, Rohlfs和Nielsen (2015)提出了基因表达变异和进化(expression variance and evolution, EVE)模型(表2), 该模型假设第i个物种的第k个体某个基因表达水平xik服从正态分布:
(2) 目前仍以mRNA拷贝数量来度量基因表达水平, 已提出了多种基因表达的计算方法, 包括2-ΔΔCT和Pfaffl等度量方法以及数据标准化方法(RPKM、FPKM和TPM)。利用这些度量方法分析植物生态与进化问题是生物学研究的热点之一, 但是如何准确地利用基因表达水平变异定位隐含的调控因子基因仍是亟待解决的关键问题, 目前利用基因表达数据进行GWAS, 进而估计调控因子基因eQTL仍受许多因素限制, 包括样本容量、eQTL与基因组SNP连锁不平衡以及植物特定细胞或组织混合基因表达等。
(1) 类似于研究分子进化中的MK (McDonald- Kreitman) (Mcdonald and Kreitman, 1991)方法(检测种间基因序列进化是否存在选择作用), 假设1个基因表达的所有调控因子基因在种内变异和种间进化完全由突变产生, 理论上种内基因表达方差和种间基因表达方差相等(H0假设), 备选假设(H1)为种间基因表达进化存在稳定选择或歧化选择(disruptive selection), 通过测验推测是否存在选择效应.该方法的缺点是假设种间是独立的, 忽视了种间系统发育关系对基因表达进化的影响, 其次, 基因表达进化随时间增加且无上限, 漂变导致种间基因表达进化可能会被误认为是定向选择(Price et al., 2022). ...
Overexpression of a SOC1-related gene promotes bud break in ecodormant poplars
1
2021
... 基因表达水平类似于数量性状, 与基因本身的分子进化不同, 其表达水平的变异反映了影响该基因表达的调控因子的遗传变异(Mostafavi et al., 2023).如何准确测定基因的表达水平以及如何利用基因表达水平的变异来推测基因表达进化? 基因表达进化与基因序列变异或其翻译的蛋白质序列变异有怎样的联系? 这些问题有待深入探讨.广义上说, 基因表达水平测定不仅是理解基因功能和调控机制的基础(Gómez-Soto et al., 2021; Irving et al., 2022; Sezen et al., 2024), 也是疾病诊断和药物研发的关键环节(Wu et al., 2020; Parikh et al., 2020; Bernabè et al., 2021; Feng et al., 2021).近十几年, 高通量测序技术的应用为基因表达测定及其变异分析提供了有效手段.本文将概述基因表达水平的测定方法, 探讨如何利用基因表达水平变异分析调控因子基因的进化机制, 从而理解基因表达进化与基因分子进化之间的关系. ...
The strength and pattern of natural selection on gene expression in rice
1
2020
... (2) 利用两世代的调查数据进行回归分析, 测验基因表达与有关适应性数量性状的关联性来推测是否存在选择.基于适合度的自然选择变化估计选择差S, 相应的群体基因表达量的均值变化(跨越1个世代的选择响应) R, 育种学上又称为遗传增益, 根据育种者方程(breeder’s equation)估计基因表达的选择梯度参数β, 即β=R/S, 选择梯度β可用于指示表达基因的选择强度, β数值大小反映了该基因表达的选择强度.该方法在水稻育种中得到应用, 发现在湿稻田条件下, 多数基因表达处于中性或弱稳定选择(stabilizing selection), 但在干旱条件下处于强选择, 且基因表达的选择强度与cis-调控因子表达水平及网络连接性存在弱负相关(Groen et al., 2020). ...
2
2010
... 式中x0为基因在祖先群体中的表达水平或物种分化初始时的表达水平, σ2为BM过程中基因表达方差, t为种群分化时间.Lande (1976)在分析时, 采用基因表达均值分布, 即f(xˉ)~N(x0,?tσA2/Ne),方差随着物种分化时间t而增加.依据该分布可以构建出有效群体大小(Ne)置信区间, 并与实际估值比较来判断是否接受漂变效应.理论上, 可同时考虑基因在祖先群体中的表达水平(x0)分布和子代物种间的表达分布(x0), 以估计相关的基因表达参数(Gu, 2010). ...

(1) 类似于研究分子进化中的MK (McDonald- Kreitman) (Mcdonald and Kreitman, 1991)方法(检测种间基因序列进化是否存在选择作用), 假设1个基因表达的所有调控因子基因在种内变异和种间进化完全由突变产生, 理论上种内基因表达方差和种间基因表达方差相等(H0假设), 备选假设(H1)为种间基因表达进化存在稳定选择或歧化选择(disruptive selection), 通过测验推测是否存在选择效应.该方法的缺点是假设种间是独立的, 忽视了种间系统发育关系对基因表达进化的影响, 其次, 基因表达进化随时间增加且无上限, 漂变导致种间基因表达进化可能会被误认为是定向选择(Price et al., 2022). ...
On the probability of fixation of mutant genes in a population
1
1962
... (1) 单个基因表达已有明确的基因类型, 表达水平受调控因子和基因本身序列进化影响, 后者在基因表达进化研究中常被忽略, 但可以从基因表达进化、选择程度(4Nes, s为突变等位基因选择系数)及基因分子进化速率(Ka)三者关系中推测(Kimura, 1962): 对于有利突变等位基因(s>0), Ka=μ?4Nes1-e-4Nes (μ为突变率); 对于有害突变等位基因(s<0),Ka=μ?4Nese4Nes-1.有利突变等位基因在群体中固定概率大, 分子进化速率高, 当群体中有利等位基因比有害等位基因频率高时, 有利等位基因在群体基因表达水平的变异中会占主要部分, 且比有害等位基因表达水平高, 反之亦然. ...
Natural selection and random genetic drift in phenotypic evolution
2
1976
... 随着物种分化时间(t)的增长, 基因表达均值的方差就越大.实际测验时, 可应用单因素方差分析(ANOVA)估计种群间基因表达方差σ^B2(t),应用Lande (1976)提出的F测验: ...

(1) 类似于研究分子进化中的MK (McDonald- Kreitman) (Mcdonald and Kreitman, 1991)方法(检测种间基因序列进化是否存在选择作用), 假设1个基因表达的所有调控因子基因在种内变异和种间进化完全由突变产生, 理论上种内基因表达方差和种间基因表达方差相等(H0假设), 备选假设(H1)为种间基因表达进化存在稳定选择或歧化选择(disruptive selection), 通过测验推测是否存在选择效应.该方法的缺点是假设种间是独立的, 忽视了种间系统发育关系对基因表达进化的影响, 其次, 基因表达进化随时间增加且无上限, 漂变导致种间基因表达进化可能会被误认为是定向选择(Price et al., 2022). ...
Ecological transcriptomics reveals stress response pathways of a ground-herb species in a waterlogging gradient of Amazonian riparian forests
1
2024
... 基因表达在生态与进化生物学方面有广泛应用.例如, Palma-Silva等(2024)利用基因表达评价竹芋科细穗竹芋属植物Ischnosiphon colombianus在亚马逊河岸森林系统中对2种环境的响应, 认为不同环境条件和洪涝灾害是种群遗传分化的驱动因素.Andrew等(2024)研究了澳大利亚17个相思树属(Acacia)树种响应热胁迫后的基因表达与环境关联性.基因表达测定也常用于分析特定基因在植物不同组织器官中的表达定位, 以及比较物种间或不同环境条件下的基因表达模式差异等(Wu et al., 2024), 依据统计学检验筛选表达差异显著的基因并进行注释, 但这类研究一般不探究基因表达调控因子. ...
Identification and functional annotation of long intergenic non- coding RNAs in Brassicaceae
1
2022
... lncRNA在调控植物开花时间、器官发生以及应对生物和非生物胁迫等方面发挥作用.Shea等(2019)通过对春化过程中的蔓菁(Brassica rapa)转录组进行分析, 发现许多lncRNA在冷处理后表达发生显著改变, 部分差异表达的mRNA与其对应的lncRNA在表达上呈现协同变化的趋势.Wang等(2021a)发现了多个与次生细胞壁生物合成相关的lncRNA及其调控网络, 明确了其在毛竹(Phyllostachys edulis)快速生长过程中的表达模式和潜在功能.Palos等(2022)对十字花科(Brassicaceae) 4种植物的研究表明, 约10%的lncRNA响应胁迫.这些响应多与温度胁迫有关, 部分与脱落酸(ABA)响应相关, 且呈现特异性表达模式.综上表明, lncRNA在植物生长发育及应对环境胁迫过程中具有重要作用, 其功能多样且调控机制复杂, 未来还需深入研究其作用机制. ...
1
2019
... 植物转录因子包括多个家族, 每个家族包含多种成员, 它们可以识别相似但略有不同的DNA序列, 从而在不同的细胞类型和生理条件下发挥不同的调控作用.以植物WRKY转录因子家族为例, 不同种类植物中WRKY基因家族成员的数量存在差异, 它们通过特异性结合启动子区域的W-box来调控基因表达.在拟南芥(Arabidopsis thaliana)中共发现90个WRKY成员, 而在沟叶结缕草(Zoysia matrella)中则发现269个WRKY成员(Tian et al., 2020).近期对植物WRKY基因家族进行全基因组鉴定, 并分析其结构、功能以及在不同组织或生长发育过程中的表达模式(黄诗宇等, 2024; 黄金龙等, 2024).有研究表明, WRKY转录因子在病害抗性(潘钰, 2019; 于晓跃, 2021)、发育和激素控制过程(陈宇翔, 2020; Chen et al., 2021; 柳金华, 2023), 尤其是非生物胁迫响应(张艺腾, 2022; 杨建坤, 2023; 穆宣邑等, 2024)等方面发挥重要作用.苏文娟等(2023)研究发现, 油茶(Camellia oleifera)大部分CoWRKYs基因正向调控抗逆胁迫响应, 其中部分基因受干旱和盐胁迫诱导上调表达, 表明WRKY转录因子参与调控非生物胁迫响应. ...
1
2019
... 植物转录因子包括多个家族, 每个家族包含多种成员, 它们可以识别相似但略有不同的DNA序列, 从而在不同的细胞类型和生理条件下发挥不同的调控作用.以植物WRKY转录因子家族为例, 不同种类植物中WRKY基因家族成员的数量存在差异, 它们通过特异性结合启动子区域的W-box来调控基因表达.在拟南芥(Arabidopsis thaliana)中共发现90个WRKY成员, 而在沟叶结缕草(Zoysia matrella)中则发现269个WRKY成员(Tian et al., 2020).近期对植物WRKY基因家族进行全基因组鉴定, 并分析其结构、功能以及在不同组织或生长发育过程中的表达模式(黄诗宇等, 2024; 黄金龙等, 2024).有研究表明, WRKY转录因子在病害抗性(潘钰, 2019; 于晓跃, 2021)、发育和激素控制过程(陈宇翔, 2020; Chen et al., 2021; 柳金华, 2023), 尤其是非生物胁迫响应(张艺腾, 2022; 杨建坤, 2023; 穆宣邑等, 2024)等方面发挥重要作用.苏文娟等(2023)研究发现, 油茶(Camellia oleifera)大部分CoWRKYs基因正向调控抗逆胁迫响应, 其中部分基因受干旱和盐胁迫诱导上调表达, 表明WRKY转录因子参与调控非生物胁迫响应. ...
Steroid hormones and hormone antagonists regulate the neural marker neurotrimin in uterine leiomyoma
1
2020
... 基因表达水平类似于数量性状, 与基因本身的分子进化不同, 其表达水平的变异反映了影响该基因表达的调控因子的遗传变异(Mostafavi et al., 2023).如何准确测定基因的表达水平以及如何利用基因表达水平的变异来推测基因表达进化? 基因表达进化与基因序列变异或其翻译的蛋白质序列变异有怎样的联系? 这些问题有待深入探讨.广义上说, 基因表达水平测定不仅是理解基因功能和调控机制的基础(Gómez-Soto et al., 2021; Irving et al., 2022; Sezen et al., 2024), 也是疾病诊断和药物研发的关键环节(Wu et al., 2020; Parikh et al., 2020; Bernabè et al., 2021; Feng et al., 2021).近十几年, 高通量测序技术的应用为基因表达测定及其变异分析提供了有效手段.本文将概述基因表达水平的测定方法, 探讨如何利用基因表达水平变异分析调控因子基因的进化机制, 从而理解基因表达进化与基因分子进化之间的关系. ...
Deep learning the cis-regulatory code for gene expression in selected model plants
1
2024
... 总之, 基于基因表达数据进行GWAS估计调控因子仍然是一个重要途径, 是对现有转录因子进行筛选和识别分析的补充, 筛选出的调控因子通常需要进一的步实验验证(Wang et al., 2021b; Peleke et al., 2024). ...
geiger v2.0: an expanded suite of methods for fitting macroevolutionary models to phylogenetic trees
1
2014
... 式中O为表达水平在种内的最优表达水平值, λ为选择强度(Bedford and Hartl, 2009).随着分化时间t的延长, 基因表达密度分布趋于limtfx|x0,O,λ,σ,t~NO,σ22λ分布, 方差趋于稳定, 均值趋于最优表达值, 通过建立似然函数可以获得参数Oλσ的极大似然估计值.该模型也可以拓宽到分析特定的进化分支, 允许有不同的最佳表达值, 类似于定向选择模型.目前该检测方法已得到一定应用(Price et al., 2022), 有开发的R程序包OUwie (Beaulieu et al., 2012)和geiger (Pennell et al., 2014)函数.该方法的缺点是没有利用种内基因表达变异信息, 未考虑环境差异等因素带来的基因表达变异. ...
A viral suppressor modulates the plant immune response early in infection by regulating microRNA activity
1
2018
... siRNA主要由类似于Dicer酶作用产生, 这些酶将双链RNA切割成短小的干扰RNA片段, 通过与Argonaute蛋白形成复合物(RISC)作用于目标mRNA, 导致其降解或翻译被抑制(Shamandi et al., 2015).利用经过筛选的siRNA可以特异性下调特定的基因或基因组表达, 还可以调控基因沉默的程度、时间和范围.这在植物的基因表达调控中发挥重要作用, 尤其是在对抗转座元件和病毒的防御机制中, 是植物防御病毒的重要机制之一.但病毒也会形成逃避干扰机制, 一些病毒编码的抑制蛋白能够结合并消耗siRNA, 从而减少植物体内有效的抗病毒siRNA数量(Pertermann et al., 2018).在植物与病毒的相互作用中, 除了miRNA直接介导的基因沉默外, 还有复杂的分子机制参与调控siRNA的生成和功能. ...
Selection for pollen competitive ability in mixed-mating systems
1
2018
... 式中, Q为迁移基因频率, msmP依次为种子和花粉迁移率, α为自交率.花粉流直接影响花粉基因表达, 而种子迁移则影响全基因组基因表达, 由于植物子房不迁移, 因此不受外来因素影响.在自交条件下, 花粉基因表达可能不会受到强烈的选择压力(Peters and Weis, 2018), 因为自交植物的花粉直接与自身的卵细胞结合, 减少了与其它花粉竞争的机会.与异交植物相比, 自交植物迁入率降低, 基因频率趋于迁移基因频率(Q)速度慢, 调控因子基因也有类似的模式.这样种群内基因表达方差趋于迁移群体的基因表达方差, 比异交物种基因表达方差变化慢, 但亚群体间基因表达方差比异交物种大.自交与种间基因流(基因渐渗)互作, 减少基因及其调控因子基因在种间的交换, 加快了种间基因表达进化. ...
A new mathematical model for relative quantification in real-time RT-PCR
1
2001
... 基因表达水平可以用绝对和相对表达量来表示, 前者指在特定条件下, 基因的表达量可以被直接量化为一个具体的数值, 这种方法通常需要使用标准样品或已知浓度的样品做参考(Bustin, 2000; Eppler et al., 2005), 实验要求较高, 步骤较烦琐.后者则是通过比较目标RNA分子在不同样品或不同条件下的表达水平变化来估计其相对表达量(Fleige et al., 2006), 这种方法通常选择1个或多个内参基因作为对照, 以校正样品间的差异.衡量基因相对表达量常用的方法有2-ΔΔCT法(Livak and Schmittgen, 2001)和Pfaffl法(Pfaffl, 2001).应用RNA-seq分析时, 同时测定多基因表达水平, 为消除基因长度和测序深度对基因表达水平的影响, 需将数据进行归一化处理(Evans et al., 2018), 常用RPKM (reads per kilobase per million)、FPKM (fragments per kilobase per million) (Mortazavi et al., 2008)以及TPM (transcripts per million)表示(Wagner et al., 2012). ...
Detecting signatures of selection on gene expression
3
2022
... (1) 类似于研究分子进化中的MK (McDonald- Kreitman) (Mcdonald and Kreitman, 1991)方法(检测种间基因序列进化是否存在选择作用), 假设1个基因表达的所有调控因子基因在种内变异和种间进化完全由突变产生, 理论上种内基因表达方差和种间基因表达方差相等(H0假设), 备选假设(H1)为种间基因表达进化存在稳定选择或歧化选择(disruptive selection), 通过测验推测是否存在选择效应.该方法的缺点是假设种间是独立的, 忽视了种间系统发育关系对基因表达进化的影响, 其次, 基因表达进化随时间增加且无上限, 漂变导致种间基因表达进化可能会被误认为是定向选择(Price et al., 2022). ...

本文的其它图/表