藿香
叶绿体
基因组
密码子
偏好
分析
梁湘兰
基金项目:本研究由广西科技师范学院高层次人才启动经费(GXKS2020GKY009)、广西高校中青年教师科研基础能力提升项目(2021KY0862)和广西科技师范学院特色瑶药资源研究与开发校级重点实验室经费(KJ5CSH000005)共同资助引用格式:LiangX.L.,Qin Y.M.,Sun X.B.,and Guo S.,2023,Analysis ofcodon usage bias in the chloroplast genome of Agastache rugosa,Fenzi Zhiwu Yuzhong(Molecular Plant Breeding),21(3):809-818.(梁湘兰,覃逸明,孙晓波,郭松,2023,藿香叶绿体基因组密码子偏好性分析,分子植物育种,21(3):809-818.)研究报告Research Report藿香叶绿体基因组密码子偏好性分析梁湘兰覃逸明孙晓波*郭松*广西科技师范学院食品与生化工程学院,来宾,546199*共同通信作者,;摘要为确定中药藿香叶绿体基因组密码子的使用模式及其成因,本研究利用 Codon W 1.4.2 和在线软件 CUSP 对藿香叶绿体基因组中的 53 条基因编码序列密码进行中性绘图、ENC-plot 和 PR2-plot 分析。结果表明:RSCU1 的密码子有 29 个,其中有 28 个以 A/U 结尾,说明叶绿体基因组的同义密码子中偏好以 A/U结尾。藿香叶绿体基因组密码子的 GC 含量 GC1(46.95%)GC2(39.39%)GC3(28.98%),ENC 值平均值大于45,其中大于 45 的有 40 个,说明藿香叶绿体基因组存在较弱的偏性。通过中性绘图分析、ENC-plot 分析以及 PR2-plot 分析发现,藿香叶绿体基因组密码子的偏好性受到选择作用的影响为主要因素。通过构建目标基因的高低基因表达库,最终确定 19 个最优密码子:UUU、UUA、UUG、AUU、GUA、UCU、AGU、CCU、ACU、GCU、UAU、CAU、AAU、AAA、GAU、GAA、UGU、CGA、GGU。本研究为通过外源基因密码子改造后以藿香叶绿体为载体进行异源表达及种源鉴定提供了科学根据。关键词藿香;叶绿体基因组;最优密码子;密码子偏好性Analysis of Codon Usage Bias in the Chloroplast Genome of AgastacherugosaLiang XianglanQin YimingSun Xiaobo*Guo Song*College of Food and Biochemical Engineering,Guangxi Science&Technology Normal University,Laibin,546199*Co-corresponding authors,;DOI:10.13271/j.mpb.021.000809AbstractTo determine the codon usage pattern of chloroplast genome of Agastache rugosa,a total of 53 selectedprotein-coding sequences were analyzed using Codon W 1.4.2 and CUSP software,and the codons were analyzedby neutral plotting,ENC-plot and PR2-plot.The results showed that there were 29 codons with RSCU1,and 28of them ended with A/U,indicating that synonymous codons in chloroplast genome tend to end with A/U.The GCcontent of codon in chloroplast genome of A.rugosa was GC1(46.95%)GC2(39.39%)GC3(28.98%),and therewere 40 with ENC value greater than 45,which indicates that there was weak bias in chloroplast genome of A.ru-gosa.PR2-plot analysis showed that the number of genes located at the left-bottom of PR2-plot ichnography wasthe largest.Neutral mapping analysis,ENC-plot analysis and PR2-plot analysis demonstrated that the codon pref-erence of chloroplast genome of A.rugosa was mainly influenced by natural selection.Through the constructed highand low gene expression libraries,15 optimal codons were finally determined,which were UUU,UUA,UUG,AU-U,GUA,UCU,AGU,CCU,ACU,GCU,UAU,CAU,AAU,AAA,GAU,GAA,UGU,CGA,GGU.The presentstudy took some basis for the determination of chloroplast genome and genetic diversity analysis of A.rugosa.KeywordsAgastache rugosa;Chloroplast genome;Codon usage bias;Optimal codons分子植物育种,2023 年,第 21 卷,第 3 期,第 809-818 页Molecular Plant Breeding,2023,Vol.21,No.3,809-818分子植物育种Molecular Plant Breeding藿香为唇形科植物藿香(Agastache rugosa(Fisch.Et Mey.)O.Kuntze)的地上部分,在全国各地有分布(王冬梅等,2005,中草药,(9):26-27)。藿香为常用中草药,味辛、性微温,有芳香化湿和中、祛暑解表之功效,兼具药用和食用价值。藿香作为药物,具有多种药用活性成分,如紫罗兰素、醋栗素和迷迭香酸等(Seo et al.,2019;Wang et al.,2021),临床多用于消化系统疾病,包括腹痛、腹泻和呕吐等(Nam et al.,2020)。临床和药理研究表明,藿香具有抗炎、抗 HIV、抗骨质疏松、抗真菌感染、抗氧化和抗动脉粥样硬化等作用,其对肠胃具有保护作用,并具有治疗炎症性胃病的潜力(Jang et al.,2020;Lee et al.,2020;Nam et al.,2020)。藿香由于其具有清爽宜人的独特香气,也作为天然香料植物受到国内外香料研究的关注,在韩国被称为韩国薄荷。餐饮中,一般使用藿香的嫩茎叶,用于菜肴的调味,丰富菜肴的口味,同时增加菜肴的特色和营养价值等(韩颖等,2020;徐向波等,2020)。叶绿体是大部分植物光合作用不可缺少的细胞器,拥有一套独立于细胞核的遗传物质(王晓双等,2021),即叶绿体基因组。1986 年,烟草叶绿体基因组被揭示,自此以后众多的植物叶绿体基因组被测序和公开(Nie et al.,2014;梁皓辉等,2020)。根据叶绿体基因组属于母系遗传物质所具有的特点,如相对稳定的分子结构和序列信息以及进化速率适中等,叶绿体基因组被广泛用于比较分析植物的系统发育、植物的多样性,以及整体或部分基因作为 DNA 条形码的开发研究等(Chakraborty et al.,2020;尹为治等,2020;原晓龙等,2020a)。不同物种在编码氨基酸的过程中,偏向于使用一种或几种特定密码子的现象,称为密码子的偏好性(Codon usage bias)(Kong andYang,2017;原晓龙等,2020a)。不同物种间叶绿体基因组的密码子偏好性存在较大差异(梁晓静等,2021)。以叶绿体基因组为靶向的叶绿体基因工程具有明显的高效表达、方便控制转化基因的扩散和环境污染等特点,是较为理想的转化方式(王鹏良等,2019)。对一种生物体的密码子偏好性,也即密码子的使用模式进行研究,根据该物种或者个体的最优密码子对外源基因表达载体进行设计和优化,可以优化外源基因在叶绿体基因组中的表达(喻凤和韩明,2021)。分析藿香叶绿体基因组的密码子偏好性,对于藿香活性成分的合成生物学等叶绿体基因工程的研究具有重要意义。本研究通过对藿香叶绿体基因组密码子使用模式以及影响密码子使用偏性的因素进行分析,确定藿香叶绿体基因组的密码子偏好性及最优密码子,以此为藿香叶绿体基因组的应用和研究提供科学的参考依据。1结果与分析1.1藿香叶绿体基因组密码子偏性较弱通过 Codon W 1.4.2 计算各个密码子的 RSCU值,结果显示(表 1),RSCU1 的密码子有 29 个,其中以 A/U 结尾的有 28 个,说明藿香叶绿体基因组密码子偏好以 A/U 结尾。用 CUSP 计算 GC 含量和 Chips计算 ENC,结果显示(表 2),GC 含量 GC1(46.95%)GC2(39.39%)GC3(28.98%),ENC 的范围为 37.75355.669,其中大于 45 的有 40 个,ENC 的平均值为47.81,大于 45,说明藿香叶绿体基因组密码子存在较弱的偏性。1.2偏性主要受到选择作用影响利用 SPSS 19.0 分析了各个 CDS 之间的 GC 含量,密码子数目(N)、ENC 的相关性。结果显示(表 3),GC3与 GC1、GC2并无显著相关性,GCall仅与GC1、GC2、GC3显著相关,与 ENC,N 无显著相关性,而 N仅与 GC3在 0.05 级别上相关性显著。密码子第三位的碱基与第一、第二位存在差异,说明了密码子偏好性可能受到选择作用的影响较大。通过中性绘图分析(图 1)也可以看出,R2=0.0235,即相关系数 r=0.153,相关性不显著,密码子偏好性主要受到选择作用的影响。利用 R 语言程序绘制的 ENC-plot 图,可以看出,密码子主要分布于曲线的下方且离曲线分布较远(图 2)。根据 ENC 比值频率发现(表 4),组限在-0.50.5 之间有 20 个基因,在那之外的 33 个基因都图 1 藿香叶绿体基因中性绘图分析Figure 1 Neutrality plot analysis of chloroplast genes of Agasta-che rugos810在距离曲线较远位置,密码子偏好性受到选择作用的影响为主要因素。PR2-plot 绘图分析结果显示(图 3),藿香叶绿体基因组中各基因分布不均匀,少部分基因落在 A=U、G=C 中线上,落点在左下方区域的较多,说明密码子第三位碱基 U 的使用频率高于 A,C 的使用频率高于 G。若随机突变是影响密码子突变的唯一因素,那么理论上 4 种碱基的使用频率应该是相等的,但结果表明,四种碱基的使用频率并不相等,说明在藿香注:下划线表示高频密码子Note:Underlines indicate high frequency codons表 1 藿香叶绿体基因组中各氨基酸的 RSCU 分析Table 1 RSCU analysis of amino acids in chloroplast genome of Agastache rugos