温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
2023
结构
基因组
及其
研究
现状
展望
结构基因组学及其研究现状和展望
摘 要:大规模的全基因组测序方案正产生越来越多的序列信息,而理解这些信息的关键是
理解基因产物——蛋白质的功能。在后基因组时代,蛋白质的三维结构解析是解释生命密码
的重要局部。随着自动控制和基因组数据库的日益完善,结构生物学也进入了新的开展时代。
现在,结构基因组研究迅速兴起并快速开展起来,它将大大加速蛋白的结构解析过程及与其紧
密相关的蛋白功能的研究进程。结构基因组的研究将会带动生物科学各个领域及医药、农业、
酶工程等许多方面的新开展。
关键词:基因组 结构基因组学 蛋白质工厂 生产线 测定结构
一.结构基因组学的起源:
结构生物学以研究生物大分子的空间结构及其运动为根底来说明其生物学功能,在生物学
领域中占有重要地位,为揭示个体发育,生长,衰老,和死亡机理,神经活动和脑功能表现
机理,细胞增值,分化和调亡机理以及几乎一切的生命科学问题提供必要的科学根底。近年
的主要研究对象是蛋白质,包括受体蛋白,酶,通道以及与基因调控密接相关的核酸结合蛋
白等的结构与功能的研究,还瞄准那些与功能密切相关的复合物的结构如酶和底物,酶与抑
止剂,作用原与受体,DNA与其结合蛋白等。传统的结构生物学研究往往起始于生物化学
对某个蛋白质的生物学功能有一定的了解,感觉到这个蛋白的重要性,需要进一步从结构和
功能的关系上去理解蛋白质的功能调控机制,或者要从三维结构上去揭示其新的功能,这时
生物化学家才把这个蛋白交给结构生物学家去解析它的精细结构。在后基因组时代,这种“作
坊〞时的结构生物学研究已经远远不能适应生物学的大开展和医学对生物学的迫切要求,它
就笔削跨入到另一个更高的层次――工业化研究,既蛋白质结构工厂,这就是最新的结构基
因组学。
二.结构基因组学的概念
结构基因组学(structural genomics)是基因组学的一个重要组成局部和研究领域,它是一门
通过基因作图、核苷酸序列分析确定基因组成、基因定位的科学。染色体不能直接用来测序,
必须将基因组这一巨大的研究对象进行分解,使之成为较易操作的小的结构区域,这个过程就
是基因作图;根据使用的标志和手段不同,作图有4种类型,即构建生物体基因组高分辨率的遗
传图、物理图谱、序列图以及转录图谱。
三.结构基因组学的目标:
〔1〕.测定一些经过认真选择可能代表所有的折叠类型的蛋白。这样的工作量会大大减小,
并且其他蛋白质的结构可以通过计算机技术模建出来。这对分析蛋白质结构特征在系统发生
上的分布是有价值的,但是由于当前的模建技术还不能提供精确的原子结构信息,一些细微
的差异无法确定,而这些微小的差异也许对蛋白质的功能有重要影响,所以这个目标正收到
挑战。
〔2〕.测定相当数量的蛋白质结构,这些蛋白质结构来自几种模式生物的蛋白质表达谱或与
疾病相关的蛋白质表达谱。这种方式能提供更精确的结构信息,为说明生物大分子的结构与
功能提供更详实的资料。尤其是,从与疾病相关的蛋白表达谱去测定蛋白质结构,可以为疾
病机制的说明和疾病治疗提供重要信心。
四,结构基因组学的研究现状
结构基因组的研究使结构实验室转向结构工厂。巨大的结构工厂将以一种前所未有的规模,
将线性的基因组数据转化为最终的蛋白结构。
与传统的结构解析方法相比,结构基因组研究中的生产线更添了自动化操作,使整个过程得
以快速完成,这也使得大规模解析蛋白质结构得以实现。首先是基因组方案的圆满完成、
cDNA 文库的日趋完善等为结构基因组研究提供了的较好的根底,而与表达、纯化及结构测
定相关的技术的开展与设备的改良也为这一过程自动化提供了良好的条件。此过程中的重要
步骤,蛋白的结构测定技术———X光衍射和核磁共振光谱法(NMR)近年来也有了很多新
的改良,出现了很多新的功能完善的仪器。这也为生产线的顺利完成提供了保障。
利用自动化蛋白质结构生产线解析蛋白质结构是很简单快捷的,比方结晶过程的复杂步骤
也可转入计算机控制的轨道,通过改变含有蛋白质溶液的成千上万个孔的微环境完成。然而
此生产线中仍存在许多问题[2],比方:许多蛋白质在培养物中可能不能表达,或不能正确折叠,
或聚集成块从溶液中析出。膜结合蛋白尤其麻烦,因为它们在水溶液中不能正确折叠。有时
一些可溶性蛋白也很难结晶。但总体来说,结构基因组学的巨大优点现在已经很明显,前两年
中,已有约70种蛋白用DNA序列数据作为起始信息获得了结构。世界结构基因组学中心正
在全世界范围内推进整个生产线自动化方面的开展。
五.结构基因组学面临的挑战
〔1〕研究根底设施为先。蛋白质结构分析包含一系列复杂、困难的步骤。测定一个中等
的蛋白质的结构要从相应的基因序列的简单知识开始,一般要花数周到几个月的时间。这种
工作必须由博士级的科学家来做,要用高级仪器和高性能计算机。要对结构基因组学所提出
的挑战的大小有个概念,不妨以低等生物为例,即使低等生物的基因组也对上万个不同的蛋
白质编码〔对人类而言,这个数字也许超过10万〕。两个根本的实验方法——射线晶体学和
核磁共振是要用到的。 结构测定用的x射线用电子储存环产生。储存环本钱可达数亿美元,由政府建造和运行,每台机器可同时效劳十几个实验。大学的科学家的工作如得到政府有关
机构的批准和资助,他们就不必负担 . 射线费。私营企业如能负担适当比例的运行费用,
也可以在 . 射线设施上进行产权研究。几个国家正在研制自由电子激光器,这种激光
器产生的 X 射线束强度可比电子储存环的 % 射线高几个数量级。虽然这种设施仍然极其
费钱,但可向周围提供足够的X射线。
(2)第二个大挑战与结构基因组学范围相关。因为结构分析非常费钱费时,所以在选择一
组适于分析的蛋白质时必须慎之又慎。工业研究人员更喜欢关注与疾病有关的分子 &如病
毒霉’,因为这些分子可能是有希望的“药品靶子〞。学术研究人员可能更倾向于研究能洞察
更广泛的问题如细胞代谢作用或进化论的蛋白质。在这些不同类型的追求之间没有明确的界
线。也许需要确定一些协调的机制来促进有关分析什么蛋白质的信息交流,并防止不必要的
工作重复。同一蛋白质的遗传序.
(3) 知识产权构成第三个关键挑战。围绕着基因组研究成果的专利性产生的问题是有争
论的、复杂的,在一套一致的条例出现之前,法院将要忙碌一段时间。蛋白质结构本身可申
请专利的程度还没有完全解决。它们与有关列的根本专利毫无联系。从某种意义上说,知识
产权体现着对结构基因组学进步的阻碍,因为许多研究人员不愿意将可赚钱的信息投入公共
领域,这是可以理解的。尚不清楚的是,参加人类基因组方案的科学家和机构达成的标准 &
极强调原始数据的迅速公布’ 是否可以轻易地转移到政府资助的结构基因组学方案上。例
如,美国、欧洲和日本三者的专利法规差异会使问题进一步复杂化,它们的发表成果和及其
应用于专利保护之间的“宽限期〞适用规定有所不同。
六.结构基因组学继续解决的问题
〔1〕蛋白表达和纯化
许多重组蛋白表达出来成为包涵体,无法实现自动化纯化,因为每个蛋白的变性,复性
条件不大一样。还有很多蛋白在现有的表达系统中不能得到有效的表达,也就无法获得大量
的蛋白以测定其结构。而且,蛋白纯化本身就是生活化学中的一个难题。蛋白性质各异,纯
化条件可能各有千秋,这样,在蛋白纯化的自动化实现上就存在很多困难。
〔2〕晶体生长
开展高通量的晶体生长技术就是结构基因组学的一个重要方面,但是长期以来,晶体生
长就被认为是一门艺术,而不是科学。这是因为,晶体生长毫无规律可循。要得到衍射良好
的晶体样本是一个很大的挑战。此外,膜蛋白的结晶一直令晶体学家们望而生畏,而膜蛋白
占了细胞蛋白的近 30%,许多的药物靶也是以膜蛋白,膜结合蛋白为主,如膜受体,离子
通道等。由于膜蛋白固有的两亲性特征,因而极难在水溶性体系中结晶。而且,由于膜蛋白
不溶于水和它们的分子量偏大,NMR结构测定技术也常常束手无策。所以,膜蛋白的结构
测定也许是结构基因组学面临的最大挑战。还有,由于晶体生长的困难性,复杂蛋白,蛋白
复合物的结构测定在目前的技术水平上也不可能实现工业化。
〔3〕结构计算
结构修正正是结构计算过程中的一个瓶颈,需要很多的脑力资源。
〔4〕动态结构分析
对于动态的结构分析,多维核磁共振是蛋白质溶液三维结构测定的最重要手段,近年来
取得了飞速的开展,但是测定蛋白的大小仍然受到很大的约束,上限还不能突破35KD。在
这一领域一直存在这个两个备受关注的问题,即NMR测定蛋白质溶液结构的分子量有无上
限和蛋白质溶液NMR结构能否到达与X射线晶体结构相比较的分辨率水平。对结构基因组
学来说,NMR技术的数据收集时间过长〔45-60天〕,尤其数据分析时间更长〔6-12个月〕,
对高通量结构测定同样是一个很大的挑战。
七、结构基因组研究展望
结构基因组学研究具有巨大的科学意义,也具有明显的应用前景和社会,经济效益。在生
物学领域许多冲动人心的发现中,有相当大的一局部是由于生物大分子晶体结构的解析进而
在原子水平上对细胞功能活动的深入认识而取得的。生物大分子的改良和基于结构的合理药
物设计都必须依赖于生物大分子的三维空间结构的精细测定。全基因组测序方案产生了大量的功能未知蛋白,功能基因组研究想要跟上其步伐,从结构基因组学研究入手是迅速而合理
的途径,这是科学家明智的选择。三维结构信息可以获知未知蛋白质可能具有的辅基,金属
配体等,还有酶的催化位点,调节区域等。根据结构特征,可能推断出酶的催化机制,蛋白
和蛋白间的结合,蛋白和核酸的相互作用。这种对新蛋白的结构特性分析可以从结构上为其
归类,根据其结构同类家族的功能特征确定其未知功能,为功能研究提供新的视野。随着结
构基因组学的启动,产生大量的结构信息,必将带给生物学更多更深入的发现,从而把我们
对生命的认识提高到一个更新更高的境界,并促进以高科技为特征的基因组工业的迅速发
展。尤其是以重大疾病相关基因和功能基因的蛋白质表达谱为主要对象的结构基因组学的开
展,在目前的条件下具有更现实和重要的意义。
目前结构基因组研究还处于起步阶段,存在着技术上的障碍,但丰县投资家们都很自信,
Structural GenomiX公司打算把实验和理论计算机结合起来,去来发大量机诶构信息产生的
巨大商业价值。现在很多机构在研究中有很大一局部精力要放在生产线的完善上,这种情形
可能会持续5~10年。日本研究机构的领导人Yokoyama预言说:“在结构基因组学对生物
产生巨大的冲击前至少还会有5年的时间,此后,它将迅猛开展起来。〞随着研究的纵深开展, 人们的研究对象也将从现在的蛋白单体转向蛋白多聚体或是蛋白DNA、蛋白-RNA等的复
合物,结构检测也可能从现在的单结构域转向整个蛋白的结构或是研究其反响过程的动态变
化。随着结构基因组工作的进展,绝大多数工作将交由新的蛋白工厂研究,结构生物学可能从
此走向工厂化机械化操作。但这并不是意味着结构生物学家将无事可做。接下来还有更加困
难更加重要的工作,即破译蛋白结构与生物功能的关系。那时,那些有远见,有创造力的结构生
物学家将成为抢手人才。正如德国研究机构的领导人Heinemann所说,“工厂化科学并不是
结构生物学的结束,一切都将会更好的。〞
参考文献
[1]王大成.后基因组时代的结构生物学.生物化学与生物物理进展.2023,27(4):340-344
[2] 吴学军,柴建华.比较基因组学和人类基因组研究[J].生物工程进展,2023,20(1):57 61.
[3] Baxevians A D,Francis Ouellette BF著,李衍达,