温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
2023
cDNA
表达
研究
教学
课件
cDNA测序和表达谱研究 一、cDNA测序 cDNA:与信使RNA互补的DNA,代表了基因的生物学信息。基因:约占总序列的3-5 1991年,Venter等:提出大规模cDNA测序研究战略 建立了表达序列标签(expressed sequence tag,EST)技术。EST:长度为300500bp的局部cDNA 对人类基因转录图的制作、全长基因的克隆、基因表达谱的研究等有重要作用。公共数据库GenBank(:/ncbi.nlm.nih.govdbEST)UniGene:为了弄清EST间的关系,美国国立生物技术信息中心(NCBl)根据EST相似性比较进行聚类分析,形成数据库UniGene(:/ncbi.nlm.nih.govUniGene)当前cDNA测序的趋势:由对EST的随机测序,转向全长cDNA的克隆和测序。全长cDNA 是功能基因组学和比较基因组学研究的根底,有功能意义的全长cDNA可以申请专利,因此,除研究部门外,大药厂和生物技术公司也投入重金进行研究和抢占专利。目前大局部的全长基因有待于克隆。随着人类基因组DNA测序的快速进展,众多EST可供利用,生物信息学手段的增多和cDNA文库构建技术的完善,使得能够获得转录物较长的全长cDNA和低转录基因。目前,美国NIH启动了全长cDNA方案哺乳动物基因采集方案(Mammalian Gene Collection Project),加之其他国家的参加,大大加快了全长cDNA的识别和克隆工作。中国的人类基因组方案起步较晚,但坚持“有所为,有所不为的原那么,充分利用自己的资源优势和研究根底,提出对特殊组织如造血细胞、神经内分泌细胞、树突状细胞、胚胎器官等,或疾病如白血病、肝癌等进行大规模EST测序,进行基因表达谱分析,同时完成1人类全长cDNA的识别和克隆任务。(一)大规模EST测序流程 并非简单个别cDNA测序的累加,是现代生物技术和现代管理方法的结合,是生物学与计算机科学的结合。大规模EST测序:多采用流水线作业及计算机辅助管理系统。主要步骤:1)cDNA文库构建 2)DNA测序 3)信息处理和管理 4)生物信息学分析 1.cDNA文库构建 研究目的不同采用不同的cDNA文库构建方法。表达谱分析:常规的cDNA文库,如:oligo-dT引物定向克隆cDNA文库或随机引物法构建cDNA文库;获得更多的全长cDNA:构建全长cDNA文库,如:smart-PCR和oligo-PCR;增加EST种类:均一化(normalized)cDNA文库;克隆不同状态(药物处理的不同时相、不同病理及疾病的不同开展阶段等)的相关基因:减式cDNA文库构建方法。(1)oligo-dT引物定向克隆cDNA文库 最常用、大多数cDNA文库构建的方法;多数EST来自该文库。主要步骤:RNA和mRNA抽提,以mRNA为模板用oligo-dT作反转录引物合成 cDNA第一链,在DNA聚合酶I作用下合成第二链,加上接头后定向装入 噬菌体。(2)CapFinder-PCR/oligo-PCR文库 主要特点:利用mRNA 5帽状结构设计引物,该引物含有oligo(G)以对应于帽状结构的脱氧胞嘧啶,反转录反响时易于合成含有全长的第一链cDNA,用5和3引物(oligo-dT)进行PCR扩增获得双链DNA,装入噬菌体。该种文库含有较高比例的全长cDNA,也适于样本量较少的组织构建cDNA文库。(3)均一化cDNA文库 特点:将低丰度表达基因识别和克隆出来 各个实验室所采取的具体方法不同,效果也不一致。主要目的:减少测序量,尽可能识别更多的基因尤其是低转录基因。构建文库时:通过控制PCR反响减少高丰度基因扩增,或采用自身mRNA乳胶吸附方法减少高丰度mRNA;构建cDNA后,也可以通过杂交的方法去除局部高表达的基因,或者通过循环杂交、吸附的方法去除已经测序基因。(4)减式cDNA文库 根据研究目的,可采用不同的减式方法。如要获得药物处理后上调的基因,采用前向(forward)减式方法,即用药物处理前mRNA杂 交或吸附药物处理后的mRNA;反之,要获得药物处理后下调的基因,那么采用后向(backward)减式方法。缺点:该方法尚不完善和不稳定,所获得的结果需Northern印迹法证实,并且插入子的片段较短,缺少5或3端,对低丰度mRNA效果不佳。目前,多主张将减式方法和均一化方法合起来,对相关的低丰度表达基因可能效果更好。2EST测序 cDNA测序:也采用双脱氧核糖核酸法。过程主要包括:模板制备、测序反响、电泳和识别(在测序仪上进行)。测序模板制备可采用质粒抽提法或PCR扩增产物。质粒抽提法:技术较为完善,步骤:挑取菌落、细菌(质粒)增殖、质粒DNA抽提及鉴定等环节。PCR扩增产物测序:已为多数基因中心所接受,PCR模板:cDNA文库所转化的菌落、细菌裂解液或抽提的质粒;PCR扩增产物:经适当处理如纯化或酶处理等,即可进行测序。与比较:费用较为廉价,使用人员也较少,但由于文库中插入子大小不一,可能会导致PCR结果不稳定。模板制备的质量控制:极其重要,影响测序成功率的重要因素,各个环节均要质控。大规模EST测序所用模板制备多采取流水线作业方式,有条件者,可实现自动化。大规模EST测序 采用cDNA 3端或5端测序。3端测序的优点:cDNA有显著的标识poly(dT),有利于cDNA识别和去除载体;公共数据库主要是3EST,从3端测序所获得的结果便于与公共数据库比较。3端测序缺点:所获序列多在3端非编码区,而个体间或群体间在非编码区变异可能较大;公共数据库中有些基因仅提供可读框(ORF)的核苷酸和氨基酸顺序,不易判断是否新基因。5端测序。优点:常规cDNA文库所获克隆较少含有5端非编码区,而多在ORF内,5端测序的结果较容易判断是否新基因。缺点:不便于与UniGene比较,会过高估计所获得的新EST。要求:所测EST顺序的长度应大于100bp,错误率或不能识别的碱基小于3 ORF 一个由能翻译成氨基酸序列的三联体构成的阅读框称为开放读框(Open reading frame)。一段翻译成蛋白质的序列有一个阅读框架,它有一个特殊的起始密码子(AUG),从此延伸出一系列代表氨基酸的三联体,一直到终止密码子结束。3信息传输、处理和管理 很重要 要有本地(in-house)的工作站、局域网络,建立实验室信息管理系统(LIMS)及数据库系统,以传输、加工、处理和储存测序结果。整个流水线的各个环节包括试剂购置、配制、操作步骤、序列分析、菌种及质粒储存等都要有严格的管理制度和质量控制标准。实现操作标准化、信息传递和处理自动化,充分利用数据库技术和生物信息学分析工具,尽可能说明所获得信息的生物学意义,为进一步开发和利用创造条件。4生物信息学分析 生物信息学已经成为当代生命科学的重要组成成分,可用于大量生物信息资源的收集、储存、处理、搜索、共享、研究和开发。由数据库、计算机网络和应用软件三大局部组成,在基因组方案中发挥了不可取代的作用。用生物信息学分析所获得的EST测序结果是最重要的环节。要求:研究者要有渊博的生物学知识、计算机技术和应用互联网资源的能力。本地的数据库不仅储存、加工自己的EST数据,更重要的是要收集、储存并定期更新来自国际权威机构的核苷酸及蛋白质数据库信息。要有一些应用软件能进行比较、排列、检索、结构预测。国际上常用软件系统:GCG(genetics computer group)软件包,有定期更新的核苷酸及蛋白质数据库及二百多个应用软件构成,可根本满足EST序列分析的需要。EST分类 通过同源性分析,EST至少分为三类:代表基因的EST (顺序超过100bp,与基因的同源性大于95);的EST (顺序超过100bp,与EST的同源性大于95)新的EST (顺序超过100bp,与基因、EST的同源性 低于95或没有同源性)。在组织基因表达谱分析时,要进行统计学分析:EST测序过程中,基因克隆数符合Poisson分布 利用定量基因表达谱分析软件,通过聚类分析,将所测EST大局部可归于不同的UniGene。UniGene:多个EST组成,能相互重叠,可以形成较长的重叠序列。按理论,每一个UniGene可能代表一个基因,即聚类分析的目的是将所测EST归于不同基因。(二)全长cDNA的克隆 全长cDNA的识别和克隆是人类基因组方案的主要目的之一,是进行功能研究的前提。公共数据库的全长cDNA序列还较少,大局部的全长基因有待于克隆。尽管EST可能仅是基因的片段,但对基因的鉴定很重要。EST数量的大量增加,人们可以利用EST资源获得全长cDNA。EST的利用:UniGene数据库 为克隆全长cDNA提供了便利的条件。通过IMAGE协会(the Integrated Molecular Analysis of Genomes and their Expression)该协会由美国和法国的4个研究机构组成,目的是收集所有的EST克隆和顺序,并且这些克隆可以提供给研究人员。大量获得全长cDNA的策略 构建富含全长构建富含全长cDNA的文库和克隆的文库和克隆 构建富含全长构建富含全长cDNA的文库。的文库。如何获得低丰度、长的以及含有特殊结构的转录物成为难题如何获得低丰度、长的以及含有特殊结构的转录物成为难题。cDNA的文库构建方面有了较大的进展:的文库构建方面有了较大的进展:A.文库构建所用的反转录酶和文库构建所用的反转录酶和Taq酶,其忠实性能和延伸性酶,其忠实性能和延伸性能有了很大改善,所构建的能有了很大改善,所构建的cDNA的文库含有全长的文库含有全长cDNA的的克隆超过克隆超过50,其长度超过,其长度超过3kb,甚至,甚至7kb。B.根据5转录帽状结构所设计的特殊cDNA构建策略,其全长cDNA的比例较高。C.针对低丰度的转录物,除对来自各种组织、细胞的cDNA文库测序外,采取步骤去除的或已测过的顺序,如用的序列去杂交或吸附等方法处理cDNA文库,以增加低丰度的转录物被测序时机。也可以先用寡核苷酸指纹印迹法对欲测文库进行均一化处理 大规模全长cDNA测序方法 要求:cDNA文库质量更高,插入子大小最好在34kb以上。测序质量高,精度在99.99。测序从5和3同时进行。假设不能贯穿,A.可采取引物步移(primer-walking)法解决 但引物步移对工作人员素质要求较高,并要求有DNA合成仪合成大量引物。B.用鸟枪法(shotgun)或转座子法测序,测序后通过计算机拼接。该方法,易于流水线操作,不增加新的平台技术。克隆全长cDNA 与UniGene的构成非常类似,也是应用序列相似性进行排列组合。不同之处:除充分利用EST数据外,还要利用基因组DNA序列基因预测结果。克隆时,需要与上述核苷酸及蛋白质数据库进行同源性比较分析以确定是否可能含有全长的ORF。假设同源性较高,那么易判断;假设同源性较低或没有同源性,那么较难确定。此时,在保证顺序正确的同时,对翻译的顺序进行结构功能域和比较基因组分析,可帮助确定是否含有ORF。cDNA末端快速扩增法(RACE)快速克隆全长cDNA方法的有效补充 原理:利用PCR方法对cDNA所缺少的5或3端进行延伸和扩增。设计与局部cDNA互补或一致的引物,在可能高表达的cDNA库中进行5或3端延伸、扩增。组合后,可能获得全长cDNA。克隆和RACE的方法并不能直接获得克隆,可能有错误。必须进行高保真的RT-PCR扩增并亚克隆至质粒,再次测序以验证克隆的正确。全长cDNA在克隆过程中和克隆后,尤其重要。互联网上可以利用的信息:软件:比较基因组软件COG,基因组库GDB和遗传病表型库OMIM等。与核苷酸和蛋白质数据库进行同源性比较:可以提示所获顺序是否新基因,是否一个基因家族的新成员,是否在生物进化过程中保守。生物信息学分析 利用结构功能域(domain)、基序(motif)及二级和三级结构预测,可以提供新基因是否有功能相关的特殊结构,是否分泌蛋白、受体、信号传导分子、酶及转录因子等有关信息,为