分享
Linker Library:基于几何特征的骨架跃迁片段库.pdf
下载文档

ID:2745533

大小:2.90MB

页数:8页

格式:PDF

时间:2023-11-29

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
Linker Library:基于几何特征的骨架跃迁片段库 Library 基于 几何 特征 骨架 跃迁 片段
文章编号:1006-3080(2023)04-0546-08DOI:10.14135/ki.1006-3080.20220418002Linker Library:基于几何特征的骨架跃迁片段库李璐,廖奕晨,沈子豪,李洪林,李诗良(华东理工大学药学院,上海市新药设计重点实验室,上海 200237)摘要:骨架跃迁是目前应用最广泛的药物设计策略之一,但是现有骨架跃迁方法产生的化合物大多为已报道的先导化合物的衍生物或类似物,化学结构缺乏新颖性。针对现有骨架跃迁方法的局限性,提出了一种保持药效团与骨架之间的相对距离和角度不变的骨架跃迁策略,构建一个包含骨架几何特征的 linker 片段库:LinkerLibrary。该片段库可以根据骨架中心到连接点之间距离和角度,推荐结构新颖且可保持官能团相对位置的片段,有助于指导化合物的骨架跃迁并加速药物发现进程。关键词:骨架跃迁;几何特征;片段库;LinkerLibrary;药物设计中图分类号:TP392文献标志码:A新药研发过程一直以来都处于高投入、高风险、低产出的困境,一个创新药物从研发初期到成功上市,需要有 510 种同类型的药物进入临床试验;同时,为了保证进入临床试验的药物数量足够,临床前期需要得到 250 个左右的先导化合物,而这些先导化合物要通过生物测试从 500010000 个候选化合物中筛选获得1。因此,新药研发从概念的形成到成功上市,研发周期通常长达 615a,研发成本投入高达6.526 亿 USD,且投入的费用有逐年攀升的趋势2。为了提高新药的产出率,各大制药公司都致力于开发药物设计的新方法和新技术3,其中,骨架跃迁是目前药物设计中应用最广泛的策略之一。骨架跃迁的概念最早在 1999 年由 Schneider 等4提出,它是将一个药物的核心骨架替换为新的、功能相似的基团,形成结构新颖且具有较好生物活性的新化合物5。骨架跃迁在药物设计中的主要目的包括增加与靶蛋白的相互作用、调节药物分子的理化性质、增加代谢稳定性、降低毒性、避免副作用和突破现有专利的保护等6-10。目前有多种计算方法可以实现骨架跃迁,包括基于 3D 形状相似性搜索、基于分子指纹相似性搜索、药效团匹配和片段替换。其中基于片段替换的骨架跃迁可以分为 3 类:第 1 类,基于断裂键矢量,CAVEAT 是最典型的基于断裂键的连接方向进行片段替换11的方法;Rescore 除了考虑连接点的矢量外附加考虑了药效团特征12;SHOP 则进一步优化了连接点矢量的特征分布13;第 2 类,基于电子等排体,DiscoveryStudio 中的 ReplaceFragment 模块和 Open-Eye 中的 BROOD 模块都是基于生物电子等排体指导骨架跃迁14-16;CressetSPARK 在考虑静电相似性的同时会结合形状相似性17;第 3 类,基于 ADMET性质,ADMETopt 是基于 15 种 ADMET 性质推荐符合条件的骨架18;GastroPlus 中 MedchemStudio 模块通过 ADMET 性质筛选,可以同时用于指导骨架跃迁或 R 取代基优化19。但是上述策略产生的先导化合物大多为已经报道的先导化合物的衍生物或类似物,化学结构缺乏新颖性。因此,亟待解决的问题是挣脱现有骨架相似性的束缚,从一种新的角度出发实现骨架跃迁。先导化合物由药效团和骨架组成,药效团结合在骨架上形成结构完整的分子,其中药效团是药物分子产生特定生物活性所必须的结构;若替换骨架,仍然能够收稿日期:2022-04-18基金项目:国家自然科学基金面上项目(82173690)作者简介:李璐(1994),女,湖北咸宁人,硕士生,主要研究方向为计算机辅助药物设计。E-mail:lilu_dws_通信联系人:李诗良,E-mail:引用本文:李璐,廖奕晨,沈子豪,等.LinkerLibrary:基于几何特征的骨架跃迁片段库 J.华东理工大学学报(自然科学版),2023,49(4):546-553.Citation:LILu,LIAOYichen,SHENZihao,et al.LinkerLibrary:FragmentLibraryforScaffoldHoppingBasedonGeometricFeaturesJ.JournalofEastChinaUniversityofScienceandTechnology,2023,49(4):546-553.华东理工大学学报(自然科学版)Vol.49No.4546JournalofEastChinaUniversityofScienceandTechnology2023-08保持药物分子中各个药效团之间的距离和角度不变,理论上就能保持药物分子的生物活性。本文将以药效团和骨架之间的距离和角度为切入点,构建一个基于几何特征的 linker 片段库 LinkerLibrary,以期指导先导化合物的骨架跃迁。1实验部分 1.1 实验设计LinkerLibrary 用 Python3.7 语言编写,以 RDKit作为化学支持库。LinkerLibrary 使用的化合物来自剑 桥 结 构 数 据 库(Cambridge Structural Database,CSD),经 过 化 合 物 过 滤、RECAP(RetrosyntheticCombinatorialAnalysisProcedure)拆分、片段过滤、几何特征提取、容差处理后得到一个包含几何特征的LinkerLibrary。提问分子经过处理后可以从 LinkerLibrary 中搜索得到指导骨架跃迁的全部片段。总体流程如图 1 所示。1.2 片段库构建1.2.1数据来源CSD 是目前世界上应用最广泛的数据库之一,该数据库收录了化合物的三维结构信息20。与运用计算机模拟化合物生成大量构象相比,以 CSD 作为化合物的来源,优势在于其构象是真实存在的,且理论上是自然状态下的最优构象。因此,选择 CSD 的化合物作为数据来源,不仅能够降低数据的冗余同时可以获得化合物真实的坐标信息,这对于提取药效团与骨架之间的距离和角度作为描述符,具有非常重要的参考意义。在 CSD中利用包括三维结构确定、不乱序、有机化合物、无错误以及非离子等在内的过滤条件进行筛选,得到了 844703 个符合要求的有机化合物晶体。1.2.2片段生成RDKit 是最常用的开源化学信息学工具之一,如图 2 所示,本文利用 RECAP 中的11 种逆合成规则将化合物拆分成片段21。将 CSD 中的 844703 个化合物通过上述 11 种逆合成规则生成了 6188442 个片段,不同连接点的片段分布如图 3 所示。由于片段库是用于骨架跃迁,需要的是大于或等于两个连接点的 linker 片段,因此单连接点的取代基片段不在本文考虑范围之内;其中含有 2 个连接点的片段为 1473058 个,3 个连接点的片段为 109638 个,4 个连接点的片段为 4324 个,5 个及更多连接点的片段仅为 244 个。由于连接点数目越多,对应的片段数目越少,且几何特征同时匹配的可能性越低,因此本文构建的LinkerLibrary 中仅考虑连接点为 24 的片段,合计1587020 个。1.2.3坐标采集由于经过逆合成规则生成的 linker片段的连接点三维信息丢失,linker 片段显示为三维结构时所有连接点将汇聚于一点(0,0,0)。为解决上述问题,本文依次对比 linker 片段和原始分子的原子坐标,将分子中的对应原子坐标赋予连接点,还原了linker 片段的 3D 构象。图 4(a)所 示 为 逆 合 成 规 则 打 断 后 生 成 的CSDLinkersCoordinate acquisitionGeometric featureextractionTolerance processing(Distance tolerance=0.31010 mAngle tolerance=5)No ions,no errors,only organic,non-disordered,3D coordinates determined844 703 CompoundsFragment libraryRECAPRECAPFragments with 24 connection pointsLinker libraryQuery moleculeFragmentsCoordinate acquisitionGeometric feature extractionTolerance processingQuery linkersMatched linkers图1LinkerLibrary 的流程图Fig.1FlowchartofLinkerLibrary第4期李璐,等:LinkerLibrary:基于几何特征的骨架跃迁片段库547linker 片段,linker 片段的连接点以“*”表示,分别对应图 4(b)所示分子中的 N 原子和 O 原子。由于连接点的坐标丢失导致 linker 片段的 3D 构象如图 4(c)所示,连接点坐标聚于一点,将原始分子的原子坐标赋予“*”后,linker 片段恢复 3D 构象,如图 4(d)所示。赋值过程为:(1)linker 片段“*”有且仅有一个相邻 C 原子;(2)linker 片段“*”相邻 C 原子有 3 个相邻原子,其中必定有一个原子为“*”;(3)在原始分子中,读取 linker 片段“*”相邻 C 原子的 3 个相邻原子坐标,将 N 原子的坐标赋予“*”。根据 linker 片段的 SMILES 文件,可获取如下信息:(1)片段连接点数目 n(SMILES 文件“*”数目即为连接点数目);(2)片段连接点坐标*(X,Y,Z)(SMILES 文件“*”坐标即为连接点坐标)。根据上述信息可进一步计算每个片段的中心坐标 O(X,Y,Z),如式(1)所示:O(X,Y,Z)=Ni=1(Xi+Yi+Zi)N(1)O(X,Y,Z)XiYiZiNi=1(Xi+Yi+Zi)其中:为片段中心坐标,、均为坐标值,N 为片段原子总数;为片段原子坐标之和。1.2.4特征提取基于几何特征的片段库,选取的几何特征描述符分别是距离和角度。如图 5 所示,距离为连接点到中心的距离,如 OA、OB、OC;角度为两个连接点与中心形成的夹角,如AOB、BOC、AOC。AOCB图5几何特征描述符Fig.5GeometricfeaturesdescriptorsD12采用欧式距离作为距离计算方法,即直角坐标系中两点之间的直线距离()。如式(2)所示。D12=(X1X2)2+(Y1Y2)2+(Z1Z2)2(2)采用余弦定理计算夹角余弦值,并计算得到相应的角度。如式(3)和式(4)所示。cosAOB=OA2+OB2AB22OAOB(3)AOB=180cosAOB(4)本文设计的特征描述符为固定长度的字符串,其中包含了片段的连接点数目、距离和角度信息。特征描述符中包含的原始几何特征,是指导骨架跃迁的主要依据。1.2.5容差处理本文设计的 LinkerLibrary 是基于几何特征相似原理的骨架跃迁片段库,允许匹配片段之间的距离和角度存在小范围的偏差:当所有的距离和角度均小于设定容差时,即可获得几何特征相似的片段;反之,当存在距离或角度大于容差时,则无法进行骨架跃迁。距离和角度的容差处理过程NOOONNNOONNNNNONN SOO(a)Amide(b)Ester(c)Amine(d)Urea(e)Ether(f)Olefin(g)Quartemarynitrogen(h)Aromatic nitrogenalphatic carbon(i)Lactam nitrogenalphatic carton(j)Aromatic carbonaromatic carbon(k)Sulphonamide图2RECAP 中定义的 11 种拆分规则21Fig.2Elevendefaultbondcleavagetypesinthe

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开