|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
黑涩楠叶绿体全基因组的结构和比较分析及系统进化推断
植物学报
2025, 60 (4):
573-585.
DOI: 10.11983/CBB24146
黑涩楠(Aronia melanocarpa)因其观赏价值和经济价值而闻名, 但其与其它蔷薇科植物的系统进化关系仍不明确。该研究对黑涩楠叶绿体(cp)基因组进行测序, 并与13个蔷薇科物种的叶绿体基因组进行比较分析。结果表明, 黑涩楠的cp基因组大小为159 772 bp, 呈典型的四分结构; 其中大单拷贝区(LSC)长度为87 810 bp, 小单拷贝区(SSC)长度为19 200 bp, 中间含有2个26 381 bp的反向重复区(IRa和IRb)。共注释到132个基因, 包括87个蛋白质编码基因、37个tRNA和8个rRNA。还检测到76个简单重复序列(SSR)和50个长重复序列。系统进化分析表明, 黑涩楠与红涩楠(A. arbutifolia)的亲缘关系最近, 与榅桲(Cydonia oblonga)是姊妹支系。该研究提供的基因组信息将为后续的系统进化和种群遗传分析以及分子育种提供理论支持。
表2
本研究测序的黑涩楠叶绿体基因组中的基因
正文中引用本图/表的段落
在黑涩楠cp基因组中, 共预测到132个基因, 包括87个蛋白编码基因、37个tRNA和8个rRNA。其中, 110个基因是单拷贝, 22个基因位于IR区(表1, 表2)。在22个重复基因中, 10个为蛋白编码基因, 8个编码tRNA, 4个编码rRNA (表2)。此外, 还发现45个参与光合作用的基因, 包括6个ATP合成酶亚基编码基因、12个NADH脱氢酶亚基编码基因、6个细胞色素b/f复合体亚基编码基因、5个光系统I亚基编码基因、15个光系统II亚基编码基因和1个编码Rubisco大亚基的基因(表2)。
此外, 黑涩楠cp基因组中有18个基因有内含子, 其中12个基因是蛋白编码基因, 6个基因编码tRNA。其中, 15个基因含有2个外显子, 3个基因(ycf3、clpP和rps12)含有3个外显子(表2)。值得注意的是, rps12是一个反式剪接基因, 其外显子1位于LSC区, 而外显子2和外显子3则位于IR区的2个位置, 这在许多物种中均很常见(Hildebrand et al., 1988)。此外, trnK- UUU含有最长的内含子(长度为2 490 bp), matK基因位于该内含子中。
简单重复序列(SSR)通常由1-6个核苷酸重复单元组成(Liu et al., 2018)。SSR具有多种多态性, 因此可作为确定植物分类地位和系统进化关系的有效分子标记(Fu et al., 2016)。本研究在黑涩楠cp基因组中检测到76个SSRs。大部分已鉴定的SSR为单核苷酸SSR (57个, 占85.07%), 其中单核苷酸T的频率最高, 其次是单核苷酸A和C (表3)。然而, 除3个二核苷酸(4.47%)和7个复合SSR (0.44%)外, 在黑涩楠cp基因组中未发现其它多核苷酸SSR (附表2)。SSR主要分布在LSC区(60个, 78.94%), 其次是SSC区(12个, 15.79%)和IR区(4个, 5.97%)。基因间空间包含了大部分SSR (58个, 76.32%), 而编码序列中仅检测到18个SSRs, 分别是matK、rps16、trnG-GCC、atpF、rpoC2、rpoB、atpB、clpP、rpl16、ndhA和ycf1 (附表2)。此外, rps16、trnG-GCC、clpP、rpl16、ndhA和ycf1比其它基因含有更多SSR位点。这些SSR可作为分子标记用于分析涩楠属种间的遗传变异。
在黑涩楠cp基因组中, 共预测到132个基因, 包括87个蛋白编码基因、37个tRNA和8个rRNA。其中, 110个基因是单拷贝, 22个基因位于IR区(表1, 表2)。在22个重复基因中, 10个为蛋白编码基因, 8个编码tRNA, 4个编码rRNA (表2)。此外, 还发现45个参与光合作用的基因, 包括6个ATP合成酶亚基编码基因、12个NADH脱氢酶亚基编码基因、6个细胞色素b/f复合体亚基编码基因、5个光系统I亚基编码基因、15个光系统II亚基编码基因和1个编码Rubisco大亚基的基因(表2)。
使用mVISTA在线软件, 对14种蔷薇科植物cp基因组进行BLAST分析, 并以黑涩楠为参考。比较基因组分析表明, 入选物种的基因组整体上高度保守, 尤其是在编码区(图2)。相反, 在这些物种中, 非编码区的差异更大(图2)。在非编码区, trnK-rps16、rps16-trnQ、trnG-atpA、petN-psbM、trnT-psbD、psbZ-trnG、trnT-trnL、ndhC-trnV和accD-psaI等区域的差异程度较高, 这可能是蔷薇科物种鉴定的重要候选区域。当然, 这些区域是否适合作为分子标记用于蔷薇科物种的系统进化研究仍需进一步验证。
此外, 黑涩楠cp基因组中有18个基因有内含子, 其中12个基因是蛋白编码基因, 6个基因编码tRNA。其中, 15个基因含有2个外显子, 3个基因(ycf3、clpP和rps12)含有3个外显子(表2)。值得注意的是, rps12是一个反式剪接基因, 其外显子1位于LSC区, 而外显子2和外显子3则位于IR区的2个位置, 这在许多物种中均很常见(Hildebrand et al., 1988)。此外, trnK- UUU含有最长的内含子(长度为2 490 bp), matK基因位于该内含子中。
在黑涩楠cp基因组中, 共预测到132个基因, 包括87个蛋白编码基因、37个tRNA和8个rRNA。其中, 110个基因是单拷贝, 22个基因位于IR区(表1, 表2)。在22个重复基因中, 10个为蛋白编码基因, 8个编码tRNA, 4个编码rRNA (表2)。此外, 还发现45个参与光合作用的基因, 包括6个ATP合成酶亚基编码基因、12个NADH脱氢酶亚基编码基因、6个细胞色素b/f复合体亚基编码基因、5个光系统I亚基编码基因、15个光系统II亚基编码基因和1个编码Rubisco大亚基的基因(表2)。
在黑涩楠cp基因组中, 共预测到132个基因, 包括87个蛋白编码基因、37个tRNA和8个rRNA。其中, 110个基因是单拷贝, 22个基因位于IR区(表1, 表2)。在22个重复基因中, 10个为蛋白编码基因, 8个编码tRNA, 4个编码rRNA (表2)。此外, 还发现45个参与光合作用的基因, 包括6个ATP合成酶亚基编码基因、12个NADH脱氢酶亚基编码基因、6个细胞色素b/f复合体亚基编码基因、5个光系统I亚基编码基因、15个光系统II亚基编码基因和1个编码Rubisco大亚基的基因(表2)。
附表2 黑涩楠叶绿体基因组中的简单重复序列
简单重复序列(SSR)通常由1-6个核苷酸重复单元组成(Liu et al., 2018)。SSR具有多种多态性, 因此可作为确定植物分类地位和系统进化关系的有效分子标记(Fu et al., 2016)。本研究在黑涩楠cp基因组中检测到76个SSRs。大部分已鉴定的SSR为单核苷酸SSR (57个, 占85.07%), 其中单核苷酸T的频率最高, 其次是单核苷酸A和C (表3)。然而, 除3个二核苷酸(4.47%)和7个复合SSR (0.44%)外, 在黑涩楠cp基因组中未发现其它多核苷酸SSR (附表2)。SSR主要分布在LSC区(60个, 78.94%), 其次是SSC区(12个, 15.79%)和IR区(4个, 5.97%)。基因间空间包含了大部分SSR (58个, 76.32%), 而编码序列中仅检测到18个SSRs, 分别是matK、rps16、trnG-GCC、atpF、rpoC2、rpoB、atpB、clpP、rpl16、ndhA和ycf1 (附表2)。此外, rps16、trnG-GCC、clpP、rpl16、ndhA和ycf1比其它基因含有更多SSR位点。这些SSR可作为分子标记用于分析涩楠属种间的遗传变异。
此外, 黑涩楠cp基因组中有18个基因有内含子, 其中12个基因是蛋白编码基因, 6个基因编码tRNA。其中, 15个基因含有2个外显子, 3个基因(ycf3、clpP和rps12)含有3个外显子(表2)。值得注意的是, rps12是一个反式剪接基因, 其外显子1位于LSC区, 而外显子2和外显子3则位于IR区的2个位置, 这在许多物种中均很常见(Hildebrand et al., 1988)。此外, trnK- UUU含有最长的内含子(长度为2 490 bp), matK基因位于该内含子中。
此外, 黑涩楠cp基因组中有18个基因有内含子, 其中12个基因是蛋白编码基因, 6个基因编码tRNA。其中, 15个基因含有2个外显子, 3个基因(ycf3、clpP和rps12)含有3个外显子(表2)。值得注意的是, rps12是一个反式剪接基因, 其外显子1位于LSC区, 而外显子2和外显子3则位于IR区的2个位置, 这在许多物种中均很常见(Hildebrand et al., 1988)。此外, trnK- UUU含有最长的内含子(长度为2 490 bp), matK基因位于该内含子中。
使用mVISTA在线软件, 对14种蔷薇科植物cp基因组进行BLAST分析, 并以黑涩楠为参考。比较基因组分析表明, 入选物种的基因组整体上高度保守, 尤其是在编码区(图2)。相反, 在这些物种中, 非编码区的差异更大(图2)。在非编码区, trnK-rps16、rps16-trnQ、trnG-atpA、petN-psbM、trnT-psbD、psbZ-trnG、trnT-trnL、ndhC-trnV和accD-psaI等区域的差异程度较高, 这可能是蔷薇科物种鉴定的重要候选区域。当然, 这些区域是否适合作为分子标记用于蔷薇科物种的系统进化研究仍需进一步验证。
简单重复序列(SSR)通常由1-6个核苷酸重复单元组成(Liu et al., 2018)。SSR具有多种多态性, 因此可作为确定植物分类地位和系统进化关系的有效分子标记(Fu et al., 2016)。本研究在黑涩楠cp基因组中检测到76个SSRs。大部分已鉴定的SSR为单核苷酸SSR (57个, 占85.07%), 其中单核苷酸T的频率最高, 其次是单核苷酸A和C (表3)。然而, 除3个二核苷酸(4.47%)和7个复合SSR (0.44%)外, 在黑涩楠cp基因组中未发现其它多核苷酸SSR (附表2)。SSR主要分布在LSC区(60个, 78.94%), 其次是SSC区(12个, 15.79%)和IR区(4个, 5.97%)。基因间空间包含了大部分SSR (58个, 76.32%), 而编码序列中仅检测到18个SSRs, 分别是matK、rps16、trnG-GCC、atpF、rpoC2、rpoB、atpB、clpP、rpl16、ndhA和ycf1 (附表2)。此外, rps16、trnG-GCC、clpP、rpl16、ndhA和ycf1比其它基因含有更多SSR位点。这些SSR可作为分子标记用于分析涩楠属种间的遗传变异。
简单重复序列(SSR)通常由1-6个核苷酸重复单元组成(Liu et al., 2018)。SSR具有多种多态性, 因此可作为确定植物分类地位和系统进化关系的有效分子标记(Fu et al., 2016)。本研究在黑涩楠cp基因组中检测到76个SSRs。大部分已鉴定的SSR为单核苷酸SSR (57个, 占85.07%), 其中单核苷酸T的频率最高, 其次是单核苷酸A和C (表3)。然而, 除3个二核苷酸(4.47%)和7个复合SSR (0.44%)外, 在黑涩楠cp基因组中未发现其它多核苷酸SSR (附表2)。SSR主要分布在LSC区(60个, 78.94%), 其次是SSC区(12个, 15.79%)和IR区(4个, 5.97%)。基因间空间包含了大部分SSR (58个, 76.32%), 而编码序列中仅检测到18个SSRs, 分别是matK、rps16、trnG-GCC、atpF、rpoC2、rpoB、atpB、clpP、rpl16、ndhA和ycf1 (附表2)。此外, rps16、trnG-GCC、clpP、rpl16、ndhA和ycf1比其它基因含有更多SSR位点。这些SSR可作为分子标记用于分析涩楠属种间的遗传变异。
附表2 黑涩楠叶绿体基因组中的简单重复序列
在黑涩楠cp基因组中, 共预测到132个基因, 包括87个蛋白编码基因、37个tRNA和8个rRNA。其中, 110个基因是单拷贝, 22个基因位于IR区(表1, 表2)。在22个重复基因中, 10个为蛋白编码基因, 8个编码tRNA, 4个编码rRNA (表2)。此外, 还发现45个参与光合作用的基因, 包括6个ATP合成酶亚基编码基因、12个NADH脱氢酶亚基编码基因、6个细胞色素b/f复合体亚基编码基因、5个光系统I亚基编码基因、15个光系统II亚基编码基因和1个编码Rubisco大亚基的基因(表2)。
使用mVISTA在线软件, 对14种蔷薇科植物cp基因组进行BLAST分析, 并以黑涩楠为参考。比较基因组分析表明, 入选物种的基因组整体上高度保守, 尤其是在编码区(图2)。相反, 在这些物种中, 非编码区的差异更大(图2)。在非编码区, trnK-rps16、rps16-trnQ、trnG-atpA、petN-psbM、trnT-psbD、psbZ-trnG、trnT-trnL、ndhC-trnV和accD-psaI等区域的差异程度较高, 这可能是蔷薇科物种鉴定的重要候选区域。当然, 这些区域是否适合作为分子标记用于蔷薇科物种的系统进化研究仍需进一步验证。
使用mVISTA在线软件, 对14种蔷薇科植物cp基因组进行BLAST分析, 并以黑涩楠为参考。比较基因组分析表明, 入选物种的基因组整体上高度保守, 尤其是在编码区(图2)。相反, 在这些物种中, 非编码区的差异更大(图2)。在非编码区, trnK-rps16、rps16-trnQ、trnG-atpA、petN-psbM、trnT-psbD、psbZ-trnG、trnT-trnL、ndhC-trnV和accD-psaI等区域的差异程度较高, 这可能是蔷薇科物种鉴定的重要候选区域。当然, 这些区域是否适合作为分子标记用于蔷薇科物种的系统进化研究仍需进一步验证。
此外, 黑涩楠cp基因组中有18个基因有内含子, 其中12个基因是蛋白编码基因, 6个基因编码tRNA。其中, 15个基因含有2个外显子, 3个基因(ycf3、clpP和rps12)含有3个外显子(表2)。值得注意的是, rps12是一个反式剪接基因, 其外显子1位于LSC区, 而外显子2和外显子3则位于IR区的2个位置, 这在许多物种中均很常见(Hildebrand et al., 1988)。此外, trnK- UUU含有最长的内含子(长度为2 490 bp), matK基因位于该内含子中。
附表2 黑涩楠叶绿体基因组中的简单重复序列
附表2 黑涩楠叶绿体基因组中的简单重复序列
简单重复序列(SSR)通常由1-6个核苷酸重复单元组成(Liu et al., 2018)。SSR具有多种多态性, 因此可作为确定植物分类地位和系统进化关系的有效分子标记(Fu et al., 2016)。本研究在黑涩楠cp基因组中检测到76个SSRs。大部分已鉴定的SSR为单核苷酸SSR (57个, 占85.07%), 其中单核苷酸T的频率最高, 其次是单核苷酸A和C (表3)。然而, 除3个二核苷酸(4.47%)和7个复合SSR (0.44%)外, 在黑涩楠cp基因组中未发现其它多核苷酸SSR (附表2)。SSR主要分布在LSC区(60个, 78.94%), 其次是SSC区(12个, 15.79%)和IR区(4个, 5.97%)。基因间空间包含了大部分SSR (58个, 76.32%), 而编码序列中仅检测到18个SSRs, 分别是matK、rps16、trnG-GCC、atpF、rpoC2、rpoB、atpB、clpP、rpl16、ndhA和ycf1 (附表2)。此外, rps16、trnG-GCC、clpP、rpl16、ndhA和ycf1比其它基因含有更多SSR位点。这些SSR可作为分子标记用于分析涩楠属种间的遗传变异。
使用mVISTA在线软件, 对14种蔷薇科植物cp基因组进行BLAST分析, 并以黑涩楠为参考。比较基因组分析表明, 入选物种的基因组整体上高度保守, 尤其是在编码区(图2)。相反, 在这些物种中, 非编码区的差异更大(图2)。在非编码区, trnK-rps16、rps16-trnQ、trnG-atpA、petN-psbM、trnT-psbD、psbZ-trnG、trnT-trnL、ndhC-trnV和accD-psaI等区域的差异程度较高, 这可能是蔷薇科物种鉴定的重要候选区域。当然, 这些区域是否适合作为分子标记用于蔷薇科物种的系统进化研究仍需进一步验证。
附表2 黑涩楠叶绿体基因组中的简单重复序列
本文的其它图/表
|