星毛唐松
草叶
基因组
及其
密码子
偏好
分析
DOI:10.11929/j.swfu.202205026引文格式:侯哲,娄晓鸣,李昂,等.星毛唐松草叶绿体基因组的测序及其密码子偏好性分析 J.西南林业大学学报(自然科学),2023,43(5):4756.星毛唐松草叶绿体基因组的测序及其密码子偏好性分析侯哲娄晓鸣李昂黄长兵(苏州农业职业技术学院,江苏苏州215008)摘要:通过全基因组重测序数据对星毛唐松草的叶绿体基因组进行组装,并对其密码子偏好性进行分析。结果表明:星毛唐松草的叶绿体基因组全长为 155969bp,具有非常典型的四分体结构;密码子偏好性分析表明,筛选的 48 条基因序列中,GC1、GC2、GC3的平均含量分别为 47.97,39.99,30.07,表现出显著的差异;有效密码子数(ENC)与 GC1和 GC2的相关性不显著,而与 GC3显著相关;中性绘图分析表明 GC3与 GC12的相关性显著,且密码子的偏好性受自然选择的影响;ENCplot 及 ENC 比值频数分布结果表明,大多数基因的 ENC 值低于预期值,仅有 10 个基因受到突变的影响,其他基因则主要受到自然选择的影响;同义密码子相对使用度(RSCU)分析表明,18 个最优密码子均以 A 和 U 结尾。该研究为星毛唐松草叶绿体基因工程的开展奠定了基础,为其遗传多样性、遗传结构及群体遗传学的研究提供了参考信息。关键词:星毛唐松草;叶绿体基因组;密码子偏好性;最优密码子中图分类号:Q343.1文献标志码:A文章编号:20951914(2023)05004710CharacteristicsofThalictrum cirrhosumChloroplastGenomeandItsAnalysisonCodonUsageBiasHouZhe,LouXiaoming,LiAng,HuangChangbing(SuzhouPolytechnicInstituteofAgriculture,SuzhouJiangsu215008,China)Abstract:Thisstudyusedwhole-genomeresequencingdatatoassemblethechloroplastgenome(chloroplast,cp)ofT.cirrhosumandtoanalyseitsphylogeneticrelationshipswithinthegenusThalictrum.TheresultsshowedthatthechloroplastgenomeofT.cirrhosumis155969bpinlength,withaverytypicalquadripartitestructure;thecodonpreferenceanalysisshowedthattheaveragecontentsofGC1,GC2andGC3were47.97,39.99and30.07,respectively,amongthe48genesequencesscreened;thecorrelationofENCvalueswithGC1andGC2wasnotsignificant,whilethecorrelationcoefficientwithGC3wassignificantlycorrelated;theneutralmappinganalysisshowssignificantcorrelationbetweenGC3andGC12andthatcodonpreferenceisinfluencedbynaturalselection;theENCplotandENCratiofrequencydistributionresultsshowthatmostgeneshaveENCvalueslowerthanex-pected,withonly10genesareaffectedbymutations,whiletheremaininggenesaremainlyaffectedbynaturalse-lection;theRSCUanalysisshowedthat18optimalcodonshaveAandUendings.Thisstudylaysthefoundation收稿日期:20220508;修回日期:20220704基金项目:江苏省特色花卉工程中心项目(苏发改高技发 20201460 号)资助;江苏省省级作物种质资源库(球宿根花卉)项目(JSZWK05)资助;四川省自然科学基金项目(2022NSFSC1141)资助。第 1 作者:侯哲(1991),男,博士,讲师。研究方向:园林植物抗逆性分子机制。Email:。通信作者:黄长兵(1979),男,硕士,副研究员。研究方向:观赏植物新品种选育与抗性。Email:。第43卷第5期西南林业大学学报Vol.43No.52023年9月JOURNALOFSOUTHWESTFORESTRYUNIVERSITYSep.2023forthegeneticengineeringofthechloroplastsofT.cirrhosumandprovidesreferenceinformationforthestudyofitsgeneticdiversity,geneticstructureandpopulationgenetics.Key words:Thalictrum cirrhosum;chloroplastgenome;codonbias;optimalcodon密码子使用偏好性是植物基因组的基本特征,为理解物种进化提供了重要的信息1。每种氨基酸由 16 个密码子编码,而同义密码子是编码同一氨基酸的密码子,由于基因突变和自然选择的存在,在不同物种翻译过程中,密码子的使用频率中出现偏爱某些密码子的现象,称为密码子的偏好性23。影响密码子偏好性的因素有很多种,如漂变、突变、基因表达水平、自然选择及转运核糖核酸(tRNA)丰度等46。相对同义密码子使用率(RSCU)是指某一密码子的实际使用频率与没有密码子使用偏差时的预期频率的比值。密码子偏好是不同物种的普遍现象,虽然一定时间间隔内的偏好是不同的,但它对于物种基因组水平的研究具有重要意义7。叶绿体是绿色植物特有的细胞器,是植物进行光合作用的所在,一般认为高等植物的叶绿体具有一套自己独立的遗传物质,即叶绿体基因组8。叶绿体基因组的长度一般在 120160kb,包含110130 个基因9,且编码区的基因序列相对保守,相比其他质体基因组来说,叶绿体基因组的进化速率较低,结构相对来说也比较稳定,因此近些年来,常被用于植物的群体进化、群体遗传学和系统发育关系研究10。植物叶绿体基因组密码子偏好性的研究具有十分重要的意义:一方面,如果选取高契合度的叶绿体基因,可以帮助目的基因快速转化,提高转化效率及实现目的基因的高表达;另一方面,有助于功能基因的碱基组成,从而更好地确定目的基因的功能11。星毛唐松草(Thalictrum cirrhosum)是毛茛科(Ranunculaceae)唐松草属草本植物,一般分布于我国云南与四川一带。唐松草属(Thalic-trum)植物在全世界大约有 150 种,在中国有76 种,其中约 30 种由于富含生物碱、三萜、酚类及黄酮等具有药理活性的化合物,因而具有非常高的药用价值,根和茎常被用于治疗流感、癌症、高 血 压、细 菌 感 染 及 结 膜 炎 等 症 状12。研究发现,星毛唐松草也富含多种药理活性的化学物质,如 16 种不同的生物碱,2 种黄酮和苷类物质,3 种萜类,因而也具有很高的药用价值。目前关于星毛唐松草的研究内容较少,且多是对其化学成分的研究13。迄今为止,有关星毛唐松草叶绿体基因组方面的研究还未见报道,对其密码子偏好性的研究也比较少。鉴于此,本研究在利用基因组重测序数据组装、注释了星毛唐松草叶绿体基因组的基础上,对其密码子偏好性进行系统研究,筛选出最优密码子,为后续的叶绿体基因工程、种质资源保护及系统发育研究等提供参考。1 材料与方法 1.1 星毛唐松草样本采集、测序组装及序列筛选从 23 株星毛唐松草植物上采集新鲜的叶片,保存于液氮中直到 DNA 的提取,样本采集地点位于云南省漾濞县大平地山(254011.71N,9957 29.30 E)。使 用 TreliefTM 植 物 基 因 组DNA 试剂盒(擎科生物技术有限公司,北京),从新鲜的叶片中提取星毛唐松草的总基因组DNA。经过质量检测并纯化后,DNA 片段化后构建 400bp的文库,之后进行高通量测序(Illu-minaHiseqXTen);用 fastp 软件14对测序原始数 据 进 行 过 滤,以 粘 唐 松 草(Thalictrum vis-cosum)叶绿体基因组(NC058831)为参考基因组,使用软件 Bowtie2v.2.3.4.315对星毛唐松草的数据进行比对,然后通过软件 NOVOPlastyv4.2.116将比对后的数据进行组装。为确保叶绿体基因组组装的准确性,原始测序读数被重新比对到星毛唐松草的叶绿体基因组上,以确保最后得到的是1 条无间隙的连续序列。最终组装的叶绿体基因组用 GeSeq17和 tRNAscan18进行注释,然后用Geneious9.1.819进行人工调整和确认。最后,通过48西 南 林 业 大 学 学 报第43卷在线工具(https:/irscope.shinyapps.io/Chloroplot/)绘制星毛唐松草的叶绿体全基因组图谱。本研究结果的序列数据在 NationalCenterforBiotechno-logyInformation(NCBI)的GenBank(https:/www.ncbi.nlm.nih.gov/)上公开发表,登录号为OL711693。相关的生物项目、SRA 和生物样本编号分别为PRJNA803587、SRR17888522 和 SAMN25656791。从得到的 87 条蛋白编码基因中,删除序列过短(1 的密码子过滤到高频密码子中。然后使用 EMBOSS(https:/www.bioin-formatics.nl/emboss-explorer/)在线网站分析星毛唐松草叶绿体基因组中各个密码子的 GC1、GC2、GC3和GCall(GC1、GC2、GC3分别为密码子第1、2、3 位的 GC 含量,GCall为密码子总 GC 含量),最后,用 SPSS 在线软件(https:/www.sps- 3 个亲缘种叶绿体基因组中的蛋白质编码基因的密码子使用模式进行评估,然后使用 Tbtools20软件对密码子的使用度做热图进行分析,以确定密码子的偏好性。1.3 中性绘图分析通过中性绘图分析,可以对密码子的使用偏好性的影响因素进行分析。首先以GC3为横坐标,以 GC12GC12=(GC1+GC2)/2 为纵坐标,用Excel 绘制二维散点图并对两者进行相关性分析。如果图中分散的点沿对角线分布集中,则回归系数接近 1,得出的结果如下:GC12和GC3的差异基本相同,并且不同位置的碱基组成没有显著差异,说明该基因受到突变的影响较大。反之,如果图中的分散点不沿对角线分布,则回归系数趋于 0,则 GC12和GC3之间存在较大差异,说明该基因受到选择压力的影响较大21。1.4 ENCplot 绘图分析ENC 既可用于直观反映基因密码子使用模式,也可以用于判断突变压力或选择压力对密码子偏好性的影响,其理论范围为 2061。当数值靠近 20 时,表明密码子受突变的影响越大,反之表示密码子受到选择的影响越大22。以星毛唐松草叶绿体基因组 48 条序列中的 ENC 为纵坐标,GC3含量为横坐标,用 R 语言绘制二维散点图,构建 ENC值的期望曲线,并结合频率对差异进行一定程度的量化分析。1.5 PR2plot 绘图 1.6 最优密码子分析为得出星毛唐松草叶绿体基因组的最优密码子,首先需筛选出其高频率及高表达密码子并对其进行分析,进一步将RSCU 值1的密码子定义为高频密码子,且把筛选出的48条星毛唐松草CDS序列的ENC值从小到大排序,然后各取最低和最高的 5 组基因建立 1 个高低表达库,并用高、低两组相减,得到 RSCU 值,将 RSCU0.08 的密码子作为高表达密码子23,将同时表现为高频及高表达的密码子筛选出来作为最优密码子。2 结果与分析 2.1 星毛唐松草叶绿体基因组特征星毛唐松草叶绿体全基因组序列全长为155969bp,LSC、SSC 和 IR 区域的长度分别为85324、17657bp 和 26494bp(图 1)。与大多数被子植物的叶绿体基因组一致,星毛唐松草的叶绿体基因组呈典型的四分体结构,包含 1 个大的单拷贝区(LSC),1 个小的单拷贝区(SSC)及两个反向重复区(IRa和 IRb),基因组注释结果表明,星毛唐松草叶绿体基因组共包含 133 个基因,包括 86 个蛋白编码基因,37 个 tRNA 基因,8 个rRNA 基因和2 个假基因(图1),其中LSC区域所包含的基因最多(81 个),SSC 区域包含的基因最少(11 个),IR 区共有 34 个基因。第5期侯哲等:星毛唐松草叶绿体基因组的测序及其密码子偏好性分析49Photosystem Photosystem Cytochrome b/f complexATP synthaseNADH dehydrogenaseRubisCO large subunitPhotosystem assembly/stability factorsRNA polymeraseRibosomal proteins(SSU)Ribosomal proteins(LSU)Transfer RNAsRibosomal RNAsclpP,matKOther genesHypothetical chloroplast reading frames(ycf)Thalictrum cirrhosumchloroplast genome155 969 bp图 1 星毛唐松草叶绿体全基因组图谱Fig.1CirclegenemapoftheT.cirrhosumcpgenome 2.2 星毛唐松草密码子相关偏性指数分析为了研究星毛唐松草叶绿体基因组中密码子使用偏差的程度,计算了 48 个蛋白编码基因的ENC 值,其范围为 39.8559.17,平均值为 49.07,其中 psba 基因的 ENC 值最小,而 ndhJ 基因的ENC 值最大,显示出了不同基因之间密码子的偏好趋势(表 1)。同时,不同基因的 GC1、GC2、GC3含量存在明显的差异,各基因总体的 GC 含量为 39.40,而 GC1、GC2、GC3的平均含量分别为 47.97、39.99、30.07(表 1)。其中,第 1 位密码子的 GC 含量最大,第 3 位密码子的 GC 含量最小。而第 3 位密码子的 GC 含量差异最明显,GC3也是评估密码子偏好性的重要指标。进一步对密码子 GC 含量及其 ENC 值的相关性进行分析,结果见表 2。GC1与 GC2的相关性系数为 0.369,显示出明显的相关性(P0.05),GCall与 GC1的相关性系数为 0.810,极显著相关(P0.01),与 GC2的相关性系数为 0.655,也极50西 南 林 业 大 学 学 报第43卷显著相关(P0.01),而与 GC3的相关性系数为0.388,显著相关(P0.05)。GC3与 GC1的相关性系数为 0.055,与 GC2的相关性系数为0.099,均不具有相关性,表明星毛唐松草叶绿体基因组中,密码子第 1 位与第 2 位的碱基组成具有高度的相似度,但是第 3 位的碱基组成与第 1 位和第2 位具有显著的差异。ENC 值与 GC1和 GC2的相关性分别为 0.269 和0.059,相关性不显著,而与 GC3的相关性系数为 0.388,显著相关(P0.05),说明在星毛唐松草的叶绿体基因组中,密码子第 3 位的碱基组成与密码子的偏好性显著相关,第 3 位的碱基组成对密码子的偏好性有十分重要的影响。GC3与密码子的数量也具有显著相关性(P0.05),表明密码子第 3 位的碱基组成对密码子的数量也有一定的影响。表 1 星毛唐松草叶绿体基因组密码子不同位置 GC 含量及 ENC 值Table1GCandENCvalueofthecpchloroplastgenomeofT.cirrhosum基因GC1/%GC2/%GC3/%GCall/%ENC基因GC1/%GC2/%GC3/%GCall/%ENCpsbA49.7243.2236.1643.0339.85rpl2242.8636.2628.0235.7149.66rpl1652.9452.2128.6844.6141.54rpoC151.1037.5928.1938.9650.01atpF45.4132.4332.4336.7641.55atpA55.7139.5731.5042.2650.22ndhC49.5932.2326.4536.0942.02psaA52.3343.4134.4943.4150.80rps1251.6146.7725.0041.1342.23rpoC246.0838.2429.9038.0750.83ndhA43.4139.5622.2535.0742.55rbcL58.4043.0731.9344.4750.84petD51.7938.1029.1739.6842.80rps347.9535.6228.3137.2950.97rpl2037.2950.0030.2039.8343.62psaB48.5743.2734.4242.0951.53ndhF40.1239.1125.2034.8143.89rps1152.5257.5528.0646.0451.62atpI49.1938.3126.6138.0444.18rpoA46.4735.2928.8236.8651.94rps752.5644.8723.0840.1744.69petA50.7736.2231.8939.6351.98atpE48.5141.7929.1039.8045.43rpoB50.2338.6632.2140.3752.00ccsA35.5835.8926.0732.5246.85ndhH51.7836.8029.1939.2652.04ndhB42.4738.9430.7237.3847.30cemA39.5727.3932.1733.0452.26atpB56.7141.4830.4642.8947.51ndhI41.6738.8930.0036.8552.92psbB54.6246.3730.4543.8147.87pafII43.7843.2432.4339.8253.52petB49.0741.6739.3543.3648.09rps451.4939.6027.2339.4453.59rps846.6243.6124.8138.3548.11ndhK43.4245.1830.2639.6253.66psbD53.1143.7934.7543.8848.51pafI48.5239.0530.1839.2554.65matK38.8230.7825.2931.6348.79rpl250.5549.8234.1844.8554.81rps239.2444.3029.1139.2448.8ycf138.7729.9537.1735.2955.85ndhG44.1334.0829.0535.7549.21clpP161.5837.4437.4445.4856.98rpl1454.4736.5925.2038.7549.54ndhJ51.5736.4835.8541.3059.17accD42.2435.1030.2035.8549.56rpl2242.8636.2628.0235.7149.66第5期侯哲等:星毛唐松草叶绿体基因组的测序及其密码子偏好性分析51表 2 星毛唐松草 GC1、GC2、GC3、GCall,ENC 及GC12的相关性分析Table2CorrelationanalysisofGC1,GC2,GC3,GCall,ENCandGC12fromT.cirrhosumchloroplastgenome参数GC1GC2GC3GCallENCGC20.369*GC30.0550.099GCall0.810*0.655*0.400*ENC0.2690.0590.388*0.298GC120.850*0.795*0.0190.915*0.155注:*表示相关性显著(P0.05);*表示相关性极显著(P1 的密码子都以 A/U 为末端密码子,而以 C/G 为末端的密码子的 RSCU 值通常小于 1。48 个基因中,RSCU1 的密码子有 35 个,这些密码子被认为是星毛唐松草叶绿体基因组中出现较多的密码子。将 ENC 值从小到大排列后建立高表达基因库(pafI、rpl2、ycf1、clpP1、nd-hJ)及低表达基因库(psbA、rpl16、atpF、nd-hC、rps12),分别计算 RSCU 值后相减,得出RSCU 值,RSCU0.08 的密码子有 30 个,作为星毛唐松草叶绿体基因组的高表达基因。同时选取 RSCU1 且 RSCU0.08 的密码子作为最优密码子,表 4 中加粗且加下划线的为最优密码子,即 UUU、UCA、ACA、GCA、UAU、CAU、CAA、AAU、AAA、GAU、GAA、UGA、CGU、CGA、AGU、AGA、GGU 和 GGA,共计 18 个最优密码子,均以 A 和 U 结尾。分析比较了星毛唐松草及其属内其他 3 种近缘种的叶绿体基因组密码子偏好性(图 5),了解其密码子使用的差异。每条叶绿体基因组经过严格的过滤筛选后,分别选择 48 个蛋白编码序列(300bp)进行分析,结果表明星毛唐松草与其他唐松草属植物的密码子偏好性非常相似,对4 个物种的 RSCU 值也进行了比较,对于每一个氨基酸来说,参与其编码的所有密码子的 RSCU值之和几乎相等。另外,这些物种中相同密码子的 RSCU 值几乎相同,说明它们的密码子使用习惯比较稳定,几乎没有变化。图 5 表明,星毛唐松草与其他唐松草属植物叶绿体基因组的蛋白编码基因中,使用频率最高的密码子为 AUU,而AAA、GAA、AAU 的使用频率也相对较高,密码子使用频率较低的为 UAA、UAG 及 UGA。T.foliolosumT.foeniculaceumT.cirrhosumT.viscosumAUACAAGGAUUAUAUUUUGAUAUUAAAAAUGAAACCCAGCCCGCCGACUGUUCGGUGUACCCGACGCACGCGGGCCUCCUGGUCAGGUAAUAGUGACGGAGCUGCCGCAUGGCUGGUUUGCUUUGGCAUACUAGAGUUUUCGUAUCUAACCCAGGGAUCACAUCACCUCGUCGACUAUCCGCAAGUAAGGAG02004006008001 0001 200图 5 星毛唐松草属叶绿体基因组密码子比较Fig.5ComparativecodonanalysisofthechloroplastgenomeinT.cirrhosum续表4 氨基酸密码子RSCURSCU高表达RSCU低表达RSCU氨基酸密码子RSCURSCU高表达RSCU低表达RSCUProCCU1.551.561.640.08ArgCGU1.410.830.560.27CCC0.860.720.620.10CGC0.430.281.691.41CCA1.020.881.540.66CGA1.381.510.191.32CCG0.560.840.210.63CGG0.420.361.350.99ThrACU1.480.971.670.70SerAGU1.211.190.580.61ACC0.770.781.400.62AGC0.410.311.501.19ACA1.301.780.930.85ArgAGA1.712.190.381.81ACG0.450.4700.47AGG0.650.831.790.96AlaGCU1.661.422.000.58GlyGGU1.320.900.360.54GCC0.690.770.690.08GGC0.500.411.380.97GCA1.090.950.690.26GGA1.491.830.461.3754西 南 林 业 大 学 学 报第43卷 2.6 PR2plot 绘图分析PR2plot绘图分析中(图 6),如果各密码子的 A、T、C 和 G3位碱基的使用频率相同,则PR2plot平面图内基因应当均匀分布。但结果(图 6)表明,星毛唐松草叶绿体基因组 48 个基因分布不均匀,少部分基因落在中线上,说明其密码子偏好性受突变压力的影响,大部分基因位于 4 个区域的下方,且右下方居多,说明这 48 个基因的密码子的第 3 位的碱基使用情况为 T 大于A 且 C 大于 G,也就是说相比嘌呤 C/T,嘧啶A/G 的使用频率要更低。PR2plot绘图分析表明,星毛唐松草叶绿体基因组密码子的使用模式不仅受到突变压力的影响,自然选择也起到了一定的作用。1.01.00.50.500G3/(G3+C3)A3/(A3+T3)图 6 星毛唐松草叶绿体基因组PR2plot 绘图分析Fig.6AnalysisofPR2biasplotofT.cirrhosumchloroplastgenome 3 结论与讨论叶绿体基因组在大部分被子植物中的遗传方式为母系遗传,因而叶绿体基因组相比其他质体基因组更为保守,结构也很稳定,因而植物叶绿体基因组常被用于群体进化、种质资源鉴定及群体遗传学研究,在物种的进化过程中同样发挥着重要作用9。密码子在生物体内信息传递方面发挥着不可或缺的作用,功能基因的转录、翻译及表达同样受到密码子的影响,因而密码子的偏好性也会对功能基因的表达产生重要的作用24。密码子的使用偏好与基因表达密切相关,并影响到基因组中的蛋白质和 mRNA 水平,密码子独有的使用方法及使用偏好性会在植物长期的进化进程中逐渐累积,因而在不同的植物中,甚至同一植物不同基因间,密码子的偏好性也会各有不同,研究叶绿体基因组编码基因的密码子使用偏好性可以更好地理解功能基因的表达模式及进化方式,从而进一步了解不同物种间的进化关系25。星毛唐松草叶绿体基因组中,最丰富的氨基酸是亮氨酸,共包含 1652(9.6%)个,这与其他被子植物叶绿体基因组所报道的一致26。更有意思的是,大多数以 A/U 结尾的密码子的 RSCU 值都大于 1,而以 C/G 结尾的则小于 1,这一模式与其他植物的叶绿体基因组的使用模式一致27。植物叶绿体基因组中,密码子第 3 位通常比较保守,选择压力对其影响不大,所以 GC3是密码子偏好性评估的重要指标27。本研究发现不同基因的 GC1、GC2、GC3含量存在明显的差异,平均含量分别为 47.97、39.99、30.07,且 GC1与 GC2显著相关(P0.05),而 GC3与 GC1、GC2、GC12均没有相关性,表明星毛唐松草的密码子 A/U 含量比 C/G 含量要多,中性绘图分析结果表明密码子的偏好性受到了选择的影响,这与多种植物的研究结果一致2627。星毛唐松草叶绿体基因组筛选出的 48 条CDS 序列中,大多数基因的 ENC 值大于 45,表明这些基因的密码子具有较弱的偏好性。ENCplot分析结果表明,星毛唐松草叶绿体基因组中,绝大多数基因密码子的偏好性受到了选择作用的影响,而仅有少部分基因与突变有关,巨桉(Euca-lyptus grandis)的叶绿体基因组密码子偏好研究中,同样也发现了这一规律28。PR2plot 绘图表明,密码子第 3 位的碱基出现的规律为 T、G 大于 A、C,这一结果体现出星毛唐松草叶绿体基因组密码子偏好性不仅受到选择的影响,突变及其他因素的作用也不容忽视,这与原晓龙等29在蒜头果(Malania oleifera)研究中发现的规律一致。总结 PR2plot 及 ENCplot 结果后发现,星毛唐松草叶绿体基因组密码子使用偏好性与多种因素有关,选择是绝大多数基因密码子偏好性的主要影响因子。星毛唐松草叶绿体基因组最优密码子分析共发 现 UUU、UCA、ACA、GCA、UAU、CAU、CAA、AAU、AAA、GAU、GAA、UGA、CGU、CGA、AGU、AGA、GGU 和 GGA18 个最优密码子,且这 18 个最优密码子均以 A 和 U 结尾,这与绝大多数植物叶绿体基因组的最优密码子使用模式一致2729,表明大多数植物的叶绿体基因组密码子使用偏好性具有相似性。本研究通过高通量测序技术组装了星毛唐松草的完整的叶绿体基因组序列,并对其密码子使用模式及其偏好性进第5期侯哲等:星毛唐松草叶绿体基因组的测序及其密码子偏好性分析55行了分析,明确了其密码子偏好性的主要影响因素,并筛选出 18 个最优密码子,这为后续其他唐松草属密码子偏好性及叶绿体基因组的研究奠定了基础,且为今后星毛唐松草遗传多样性、群体遗传、种质资源的鉴定及系统发育研究提供了理论基础。参 考 文 献 SharpPM,LiWH.TheCodonAdaptationIndex:ameasureofdirectionalsynonymousCodonusagebias,and its potential applicationsJ.NucleicAcids Re-search,1987,15(3):12811295.1钱留华.密码子J.生物学通报,1997,32(4):1517.2吴学俊,梁湘兰,易子群,等.湖北山楂叶绿体基因组密码子偏好性分析J.分子植物育种,2023,21(8):25082516.3任桂萍,董璎莹,党云琨.密码子中的密码:密码子偏好性与基因表达的精细调控J.中国科学(生命科学),2019,49(7):839847.4原晓龙,康洪梅,王毅.云南蓝果树叶绿体基因组密码子偏好性分析J.西北林学院学报,2020,35(4):2631,124.5冯瑞云,梅超,王慧杰,等.籽粒苋叶绿体基因组密码子偏好性分析J.中国草地学报,2019,41(4):815.6李路丽,张萍,曾强,等.芝麻叶绿体基因组的密码子使用偏性及其影响因素J.分子植物育种,2023,21(4):45354544.7杨家鑫.掌叶木和伞花木的叶绿体全基因组研究及其系统位置分析 D.贵阳:贵州大学,2019.8Palmer J D.Comparative organization of chloroplastgenomesJ.Annual Review of Genetics,1985,19:325354.9AsafS,KhanAL,KhanAR,etal.Completechloro-plastgenomeofNicotiana otophoraanditscomparis-onwithrelatedspeciesJ.FrontiersinPlantScience,2016,7:843.10BehuraSK,SeversonDW.Codonusagebias:causat-ive factors,quantification methods and genome-widepatterns:withemphasisoninsectgenomesJ.Biolo-gicalReviewsoftheCambridgePhilosophicalSociety,2013,88(1):4961.11王文采.中国唐松草属植物 M.北京:北京大学出版社,2018.12Luo D,Lv N,Zhu L J,et al.Isoquinoline alkaloidsfromwholeplantsofThalictrum cirrhosumandtheirantirotavirus activityJ.Chemistryof Natural Com-pounds,2020,56(3):504508.13ChenSF,ZhouYQ,ChenYR,etal.Fastp:anultra-fast all-in-one FASTQ preprocessorJ.Bioinformat-ics,2018,34(17):884890.14LangmeadB,Salzberg S L.Fast gapped-read align-ment with bowtie 2J.Nature Methods,2012,9(4):357359.15DierckxsensN,MardulynP,SmitsG.NOVOPlasty:denovoassemblyoforganellegenomesfromwholegen-16ome dataJ.Nucleic Acids Research,2017,45(4):e18.TillichM,LehwarkP,PellizzerT,etal.GeSeqversat-ile and accurate annotation of organelle genomesJ.NucleicAcidsResearch,2017,45(1):6W11.17Chan P P,Lowe T M.tRNAscanSE:searching fortRNAgenesingenomicsequencesJ.MethodsinMo-lecularBiology(Clifton,NJ),2019,1962:114.18KearseM,MoirR,WilsonA,etal.GeneiousBasic:anintegrated and extendable desktop software platformfortheorganizationandanalysisofsequencedataJ.Bioinformatics,2012,28(12):16471649.19ChenCJ,ChenH,ZhangY,etal.TBtools:anintegrat-ive toolkit developed for interactive analyses of bigbiological dataJ.Molecular Plant,2020,13(8):11941202.20原晓龙,李云琴,张劲峰,等.降香黄檀叶绿体基因组密码子偏好性分析J.广西植物,2021,41(4):622630.21RozasJ,Ferrer-MataA,Snchez-DelBarrioJC,etal.DnaSP 6:DNA sequence polymorphism analysis oflarge data setsJ.Molecular Biology and Evolution,2017,34(12):32993302.22ZhuAD,GuoWH,GuptaS,etal.Evolutionarydy-namicsoftheplastidinvertedrepeat:theeffectsofex-pansion,contraction,andlossonsubstitutionratesJ.TheNewPhytologist,2016,209(4):17471756.23李真,李永光,薄蕾,等.大豆和拟南芥 NFYB 基因家族同义密码子使用偏好性的比较J.作物杂志,2014(3):1421.24LyuXL,LiuY.NonoptimalCodonusageiscriticalforprotein structure and function of the master generalaminoacidcontrolregulatorCPC1J.mBio,2020,11(5):e02605e02620.25SomaratneY,GuanDL,WangWQ,etal.Thecom-plete chloroplast genomes of two Le