分享
基于特定序列的长牡蛎视黄酸反应元件预测_李言柯.pdf
下载文档

ID:2574480

大小:1.18MB

页数:9页

格式:PDF

时间:2023-07-24

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 特定 序列 牡蛎 视黄酸 反应 元件 预测 李言柯
42卷海洋通报http:/海洋通报MARINE SCIENCE BULLETIN基于特定序列的长牡蛎视黄酸反应元件预测李言柯1,徐晓莹2,魏磊1,黄宝玉1,张美溦1,韩怡静1,刘雅琼1,王晓梅3,王晓通1(1.鲁东大学农学院,山东烟台264025;2.烟台市海洋经济研究院,山东烟台264034;3.中国水产科学研究院长岛增殖实验站,山东烟台265800)摘要:视黄酸受体和核受体超家族中的大部分成员对细胞整个分化、增殖过程都具有调控功能。视黄酸受体结合配体后激活,通过结合靶基因启动子区特定的核苷酸序列调控靶基因表达。视黄酸受体结合序列是由核心序列A/GGT/GTCA间隔不同碱基构成的重复序列,称为视黄酸反应元件。为了实现对长牡蛎基因组中含有的视黄酸反应元件的快速筛选预测,本研究利用Perl工具编写了一个可以批量筛选视黄酸反应元件的脚本,并对长牡蛎基因组中启动子区域序列进行筛选预测,共筛选到412个启动子区含有视黄酸反应元件的基因。随后,将这些基因在各种数据库中比对分析,预测其参与的生物学过程及可能的生物学功能。结果显示,大部分基因与蛋白质结合、核苷酸结合、水解酶活性、蛋白激酶活性等功能有关。关键词:长牡蛎;视黄酸受体;视黄酸反应元件;基因组;Perl中图分类号:P714+.5;Q811.4;TP313文献识别码:A文章编号:1001-6932(2023)04-0398-09Doi:10.11840/j.issn.1001-6392.2023.04.004收稿日期:2022-06-04;修订日期:2022-07-19基金项目:国家自然科学基金(41876193;41906088;42076088);国家重点研发计划(2018YFD0901400);山东省泰山学者专项基金(tsqn201812094);山东省现代农业产业技术体系(SDAIT-14-03);山东省高等学校“青创科技计划”(2019KJF004)作者简介:李言柯,硕士研究生,主要从事海洋生物基因组学研究,电子邮箱:通信作者:刘雅琼,博士,讲师,主要从事分子生物学研究,电子邮箱:王晓梅,博士,副研究员,主要从事海洋生物学研究,电子邮箱:Prediction of retinoic acid response elements based on specificsequences in the pacific oyster Crassostrea gigasLI Yanke1,XU Xiaoying2,WEI Lei1,HUANG Baoyu1,ZHANG Meiwei1,HAN Yijing1,LIU Yaqiong1,WANG Xiaomei3,WANG Xiaotong1(1.School of Agriculture,Ludong University,Yantai 264025,China;2.Yantai Institute of Marine Economy,Yantai 264034,China;3.Changdao Enhancement and Experiment Station,Chinese Academy of Fishery Sciences,Yantai 265800,China)Abstract:Most members of the retinoic acid receptor and nuclear receptor superfamily regulate the process of cell differentiationand proliferation.RA receptors are activated by binding ligands and regulate the expression of target genes by binding specificnucleotide sequences in the promoter region of target genes.The retinoic acid receptor binding sequence is composed ofA/GGT/GTCA,which is called retinoic acid response element.In order to achieve rapid screening and prediction of genescontaining retinoic acid reaction elements on Crassostrea gigas genome,this study used Perl programming to predict the geneswith retinoic acid response elements in the promoter region of genes on Crassostrea gigas genome.A total of 412 gene containingRAREs in the promoter regions were screened.Then,these genes were compared and analyzed in various databases to predicttheir biological processes and possible biological functions.The results showed that most of these genes were related to proteinbinding,nucleotide binding,hydrolase activity and protein kinase activity.Keywords:Crassostrea gigas;retinoic acid receptor;retinoic acid response element;genome;Perl第42卷第4期2023年8月Vol.42,No.4Aug.20234期http:/视黄酸(Retinoic Acid,RA)是维生素 A 的一种衍生物,在整个生物体细胞的分化、增殖以及程序性凋亡等过程中都发挥着调控功能1。视黄酸在细胞内的受体蛋白具有抑制致癌因子发挥致癌作用的效应,并在白血病2、肝癌3、乳腺癌4等肿瘤的生长中发挥作用,这也引起了研究者们对视黄酸受体的关注。实际上,人们对视黄酸受体怎样控制细胞功能的研究大多是直接根据核受体超家族中的甲状腺激素及固醇类激素等的作用机制来理解的5。视黄酸受体属于核受体,结合配体后被激活,进入细胞核中,通过结合位于靶基因调控区域的特定DNA序列调节基因表达。1987年,人们通过预测核受体超家族中除类固醇、维生素D等之外的大量未曾发现的且与调节蛋白密切相关的基因,从而确定了视黄酸受体的存在。随后发现了 RAR(RETINOIC ACID RECEPTOR)和 RXR(RETINOID X RECEPTOR)两大类视黄酸受体蛋白6,见表1。视黄酸受体与核受体超家族的基本结构相同,都是由A/B、C、D及E四个对应不同作用的结构域组成。其中,高度保守的C区含有DNA结合结构域(DNA Binding Domain,DBD),具有特异性的DNA识别序列7。核受体的DNA结合结构域包括两个“锌指(zinc fingers)”,每个“锌指”表现出不同的功能:由三个氨基酸组成一个半体,且近N端的成为“P-box”;由五个氨基酸组成且近C端的称为“D-box”8。以“P-box”为氨基酸基础序列的核受体可以被分为两组,第一组是以糖皮质激素、盐皮质激素、孕激素和雄激素受体为代表,第二组包括其他所有配体激活的核受体,包括维生素D、全反式视黄酸、9-顺视黄酸受体和大部分具有与已确认的受体相似的结构、但尚未确定其配体和功能的孤儿受体。E区是第二保守的区域,含有配体结合结构域(Ligand-BindingDomain,LBD),其功能相对复杂,包含配体结合口袋,是主要二聚化结合区域,并具有配体依赖的反激活功能7。核受体通过直接结合其调控的靶基因启动子区特异的DNA序列从而发挥功能,其结合的特异DNA序列又称为激素反应元件(Hormone ResponseElements,HREs)9。视黄酸受体结合的靶基因调控区特定序列被称为视黄酸反应元件(Retinoic AcidResponse Elements,RAREs)。研究表明,主要的RAREs的核心序列为A/GGT/GTCA,此外还有一些近似序列也可以构成RAREs10-11。视黄酸受体识别位点由核心序列组成,两个核心序列之间间隔不同数量的核苷酸组成不同的同向重复序列(DirectRepeats,DRs),例如,间隔1个核苷酸组成的序列为DR1,间隔2个核苷酸组成的序列称为DR2。第一个发现的RA反应元件为两个拷贝的A/GGGTCA核心序列组成的同向重复序列12。目前为止发现的大多数RAREs是由A/GGGTCA间隔5个碱基组成的同向重复序列DR5,是全反式视黄酸受体识别的片段。此外,A/GGGTCA间隔两个核苷酸组成的同向重复序列DR2同样也作为RAREs发挥作用。另外还鉴定到少量的9-顺式视黄酸反应元件,由同向重复的两个核心序列间隔1个碱基构成的DR1组成。研究表明,脊椎动物中RAR可以结合DR1、DR2以及DR5,而RXR识别序列为DR112。除了同向重复外,视黄酸反应元件同样识别以 8 个碱基为间隔且两个核心序列以外翻重复(Everted Repeats,ER)构成的 ER813,以及以零个碱基和一个碱基为间隔的且两个核心序列以回文序列(palindrome)构成的反向重复序列(InvertedRepeat,IR)IR0 和 IR1。另外 RARs 可以结合同向重复、外翻重复和反向重复序列及可变长度的间隔碱基的复合结构。不过,视黄酸反应元件的相对效力和特异性取决于重复序列的构型以及间隔碱基组成的核苷酸序列。研究发现以DR5组成的视黄酸反应元件通常在反式激活测定中比DR2和ER8有效,而且比间隔多个碱基的复合构型更有效。已知的视黄酸反应元件由Gigure 等5整理(见表2)。在生物信息学(Bioinformatics)中,Perl(PracticalExtraction and Report Language)有着得天独厚的优势。首先,Perl作为一个脚本语言,省去编译视黄酸受体RARRARRARRXRRXRRXR亚类1,21,21,2-基因功能反式激活抑制配子,细胞启动子活性-表1视黄酸受体类型李言柯 等:基于特定序列的长牡蛎视黄酸反应元件预测39942卷海洋通报http:/的周期过程,有着编译语言的功能,又有Shell脚本的快捷。其次,Perl不会因为数据太大而崩溃,在生物测序领域动辄上百G乃至T数量级的数据需要处理,Perl很好地契合这一点。最后,Perl中有着无比强大的正则表达式可以快速处理字符串,非常适合处理生物信息中大数据量的序列。蛋白质中酪氨酸磷酸化修饰过程是调节信号转导途径和关键细胞功能的主要机制之一。酪氨酸残基的可逆磷酸化修饰受到酪氨酸激酶和酪氨酸磷酸酶的共同调节14。酪氨酸激酶和酪氨酸磷酸酶在控制细胞生长和许多其他功能中发挥关键作用,酪氨酸磷酸化对许多细胞信号通路至关重要15。此外,有研究表明,酪氨酸磷酸化也影响一些代谢酶的活性16。另外,酪氨酸可用于蛋白质、生物胺和黑色素的生物合成,或通过五种酶促反应分解为能量,产生乙酰乙酸等并进一步分解17。长牡蛎(Crassostrea gigas)属于软体动物门,双壳纲,牡蛎目,牡蛎科,生长在全世界范围的温热带海域中18-19。在世界范围内,长牡蛎具有很高的经济价值和生态意义。对长牡蛎视黄酸受体CgRAR和CgRXR已有一定的研究20-22,但是其所调控的下游基因及下游基因的功能的相关报道较少。本文通过Perl语言编写一个可以预测视黄酸反应元件的脚本,在

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开