|
||||||||||||||||||||||||
黑涩楠叶绿体全基因组的结构和比较分析及系统进化推断
植物学报
2025, 60 (4):
573-585.
DOI: 10.11983/CBB24146
黑涩楠(Aronia melanocarpa)因其观赏价值和经济价值而闻名, 但其与其它蔷薇科植物的系统进化关系仍不明确。该研究对黑涩楠叶绿体(cp)基因组进行测序, 并与13个蔷薇科物种的叶绿体基因组进行比较分析。结果表明, 黑涩楠的cp基因组大小为159 772 bp, 呈典型的四分结构; 其中大单拷贝区(LSC)长度为87 810 bp, 小单拷贝区(SSC)长度为19 200 bp, 中间含有2个26 381 bp的反向重复区(IRa和IRb)。共注释到132个基因, 包括87个蛋白质编码基因、37个tRNA和8个rRNA。还检测到76个简单重复序列(SSR)和50个长重复序列。系统进化分析表明, 黑涩楠与红涩楠(A. arbutifolia)的亲缘关系最近, 与榅桲(Cydonia oblonga)是姊妹支系。该研究提供的基因组信息将为后续的系统进化和种群遗传分析以及分子育种提供理论支持。
表1
黑涩楠叶绿体基因组特征
正文中引用本图/表的段落
完整的黑涩楠cp基因组全长159 772 bp, 呈典型的四分结构, 这在多数植物中均有发现(Xu et al., 2017)。其包含1个长87 810 bp的LSC区和1个长19 200 bp的SSC区, 这2个区被1对长度为26 381 bp的反向重复区(IRa和IRb)隔开(图1)。整个cp基因组的总GC含量为36.6%, IR区的GC含量(42.7%)高于LSC区(34.3%)和SSC区(30.4%) (表1), 可能是由于该区域中重复的rRNA和tRNA的GC含量相对较高所致。这与前人的研究结果一致(He et al., 2016; Li et al., 2019)。
在黑涩楠cp基因组中, 共预测到132个基因, 包括87个蛋白编码基因、37个tRNA和8个rRNA。其中, 110个基因是单拷贝, 22个基因位于IR区(表1, 表2)。在22个重复基因中, 10个为蛋白编码基因, 8个编码tRNA, 4个编码rRNA (表2)。此外, 还发现45个参与光合作用的基因, 包括6个ATP合成酶亚基编码基因、12个NADH脱氢酶亚基编码基因、6个细胞色素b/f复合体亚基编码基因、5个光系统I亚基编码基因、15个光系统II亚基编码基因和1个编码Rubisco大亚基的基因(表2)。
完整的黑涩楠cp基因组全长159 772 bp, 呈典型的四分结构, 这在多数植物中均有发现(Xu et al., 2017)。其包含1个长87 810 bp的LSC区和1个长19 200 bp的SSC区, 这2个区被1对长度为26 381 bp的反向重复区(IRa和IRb)隔开(图1)。整个cp基因组的总GC含量为36.6%, IR区的GC含量(42.7%)高于LSC区(34.3%)和SSC区(30.4%) (表1), 可能是由于该区域中重复的rRNA和tRNA的GC含量相对较高所致。这与前人的研究结果一致(He et al., 2016; Li et al., 2019)。
重复序列在基因组重排和序列分化中发挥重要作用。长重复序列经常出现在基因组序列中, 是重要的分析工具(Benson, 1999)。本研究发现, 在黑涩楠cp基因组中含有50个长重复序列, 其中35个为正向重复序列, 14个为反向重复序列, 还有1个复合长重复序列。大多数重复序列分布在LSC区(31个), 其次是IRs区(16个), 仅有6个重复序列分布在SSC区。此外, 大多数重复序列分布在基因间区(34个, 占68%), 少数分布在ycf1、ycf2、ycf3、ndhA和rpl16基因中(附表1)。
在黑涩楠cp基因组中, 共预测到132个基因, 包括87个蛋白编码基因、37个tRNA和8个rRNA。其中, 110个基因是单拷贝, 22个基因位于IR区(表1, 表2)。在22个重复基因中, 10个为蛋白编码基因, 8个编码tRNA, 4个编码rRNA (表2)。此外, 还发现45个参与光合作用的基因, 包括6个ATP合成酶亚基编码基因、12个NADH脱氢酶亚基编码基因、6个细胞色素b/f复合体亚基编码基因、5个光系统I亚基编码基因、15个光系统II亚基编码基因和1个编码Rubisco大亚基的基因(表2)。
LSC、SSC和IR同
重复序列在基因组重排和序列分化中发挥重要作用。长重复序列经常出现在基因组序列中, 是重要的分析工具(Benson, 1999)。本研究发现, 在黑涩楠cp基因组中含有50个长重复序列, 其中35个为正向重复序列, 14个为反向重复序列, 还有1个复合长重复序列。大多数重复序列分布在LSC区(31个), 其次是IRs区(16个), 仅有6个重复序列分布在SSC区。此外, 大多数重复序列分布在基因间区(34个, 占68%), 少数分布在ycf1、ycf2、ycf3、ndhA和rpl16基因中(附表1)。
附表1 黑涩楠叶绿体基因组的重复序列分析
LSC、SSC和IR同
附表1 黑涩楠叶绿体基因组的重复序列分析
本文的其它图/表
|