温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
生物
信息学
方法
筛选
重度
关键
基因
潜在
治疗
药物
预测
王相
400 神经疾病与精神卫生2023年6月20日第23卷第6期 Journal of Neuroscience and Mental Health,June 20,2023,Vol.23,No.6抑郁症的精准治疗专题基于生物信息学方法筛选重度抑郁症关键基因及潜在治疗药物预测王相文 王圣海 孙辰辉 曲春晖 孙平272000 济宁医学院精神卫生学院(王相文);266034 青岛市精神卫生中心科教科(王圣海),老年二科(孙辰辉、曲春晖、孙平);200030 上海交通大学医学院附属精神卫生中心临床研究中心(孙平)通信作者:孙平,Email:DOI:10.3969/j.issn.1009-6574.2023.06.004【摘要】目的 通过生物信息学方法筛选重度抑郁症关键基因及潜在治疗药物。方法 收集GEO公共数据库中GSE98793、GSE76826数据集作为数据来源,采用在线工具及R语言进行数据分析、差异表达基因筛选和富集分析。蛋白质-蛋白质互作网络分析采用STRING数据库进行。关键基因的筛选采用Cytoscape软件。采用受试者工作特征(ROC)曲线评价诊断价值,采用Connectivity Map数据库预测治疗重度抑郁症的小分子药物。结果 筛选出TLR2、CD28、IL7R、IRF4、MAPK14共5个关键基因。ROC曲线结果显示,5个关键基因在GSE98793、GSE76826数据集中的ROC曲线下面积为0.6160.804。预测得到UBP-302、ketanserin、CS-1657、androstenol、taurocholic-acid共5种小分子药物可能对改善重度抑郁症患者症状有潜在价值。结论 TLR2、CD28、IL7R、IRF4、MAPK14可能是重度抑郁症患者发病的关键基因,UBP-302、ketanserin、CS-1657、androstenol、taurocholic-acid 5个小分子化合物可能对于抑郁症状改善有一定效果,可为后续药物研究提供思路。【关键词】生物信息学;抑郁症;差异基因基金项目:山东省医药卫生科技发展计划(2017WS748)Bioinformatics-based approach for screening hub genes and predicting potential therapeutic agents for major depressive disorder Wang Xiangwen,Wang Shenghai,Sun Chenhui,Qu Chunhui,Sun Ping School of Mental Health,Jining Medical University,Jining 272000,China(Wang XW);Department of Science and Education,Qingdao Mental Health Center,Qingdao 266034,China(Wang SH);Department II of Geriatrics,Qingdao Mental Health Center,Qingdao 266034,China(Sun CH,Qu CH,Sun P);Clinical Research Center,Shanghai Mental Health Center,Shanghai Jiao Tong University School of Medicine,Shanghai 200030,China(Sun P)Corresponding author:Sun Ping,Email:【Abstract】Objective To screen hub genes and potential therapeutic agents for major depressive disorder(MDD)by bioinformatics methods.Methods The GSE98793 and GSE76826 datasets in the GEO database were used as the data source.Data analysis,differential expression gene(DEG)screening and enrichment analysis were carried out using online tools and R soft.STRING database was used to analyze protein-protein interaction network,and Cytoscape was used to screen hub genes.Receiver operating characteristic(ROC)curve was used to evaluate the diagnostic value,and Connectivity Map database was used to predict small molecule drugs for severe MDD.Results A total of 5 hub genes(TLR2,CD28,IL7R,IRF4,MAPK14)were screened out.The ROC curve results showed that the area under the ROC curve of the 5 hub genes in the GSE98793 and GSE76826 datasets ranges from 0.616 to 0.804.It was predicted that UBP-302,ketanserin,CS-1657,androstenol,taurocholic acid,a total of 5 small molecule drugs,may have potential value in improving the symptoms of patients with major depressive disorder.Conclusions TLR2,CD28,IL7R,IRF4,MAPK14 may be key genes in the pathogenesis of MDD patients.The 5 small molecule compounds UBP-302,ketanserin,CS-1657,androstenol,and taurocholic-acid may have a certain effect on improving depressive symptoms and can provide ideas for subsequent drug research.【Key words】Bioinformatics methods;Depressive disorder;Differentially-expressed genesFund program:Shandong Provincial Medical and Health Science and Technology Development Plan(2017WS748)401 神经疾病与精神卫生2023年6月20日第23卷第6期 Journal of Neuroscience and Mental Health,June 20,2023,Vol.23,No.6重度抑郁症(major depressive disorder,MDD)是一种以心境低落、兴趣减退、认知功能受损和自主神经紊乱为核心症状的疾病1-2,位列致全球健康寿命损失年因素第5位3。世界精神卫生组织的调查显示,约20%的人群在一生中的某个时刻符合MDD的标准4。在我国成年人群体中,MDD的患病率高达3.4%5。由于抑郁症的高患病率、高自杀风险,给个人和社会带来了极大的负担。目前,临床中常用的诊断方式主要是基于症状学评估,但其标准尚待阐明6-7,而MDD的高发病率、中等遗传率为抑郁症遗传靶点的确认提出了挑战8。生物信息学分析技术在肿瘤领域已经被广泛应用,但在精神疾病领域的研究却较少。随着基因芯片、高通量测序等生命科学技术的发展,目前公开数据库中精神疾病的数据日渐完善。因此,本研究收集了两个数据集进行合并分析,筛选出MDD相关的关键基因,并预测潜在治疗药物,为治疗MDD提供新的思路。一、材料与方法1.数据收集:从美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI)下属GEO(Gene Expression Omnibus)数据库9-10中筛选GSE9879311、GSE7682612作为数据来源。两组数据集均包含MDD患者与健康对照者的系列表达矩阵数据,且上传时间均为5年内,相较于其他数据集,两者具有较强的时效性。其中GSE98793基于Affymetrix U133_Plus2.0平台测序,数据集中包含64例MDD患者及64名健康对照者,GSE76826基于Agilent SurePrint G3 Human GE 860K v2平台测序,数据集中包含20例MDD患者及12名健康对照者。两组样本均已经过归一化处理。2.差 异 表 达 基 因(differential expression gene,DEG)的筛选及数据处理:两组数据使用GEO数据库内的在线分析工具GEO2R10,13进行DEG的筛选,该在线分析工具是基于R语言3.2.3版本及limma程序包143.26.8版本的分析软件。两组数据的分析结果使用在线工具仙桃学术(https:/www.xiantao.love)进行火山图绘制,以此实现结果可视化。两组数据的DEG使用在线工具(http:/bioinformatics.psb.ugent.be/webtools/Venn)进行Venn图绘制,交集内基因被认为是共同的DEG。使用ComplexHeat map包15对两组数据进行热图绘制。3.富集分析:利用David数据库16-17(https:/DAVID.ncifcrf.gov/)进行基因本体论(Gene Ontology,GO)18-19及京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)富集功能分析,DAVID数据库是一个集成基因注释、可视化与集成发现的在线数据库,旨在为大量的基因、蛋白质体重功能注释及分析工具。GO是一种系统的对基因及其表达产物进行注释的方法和过程,其分析内容包括生物过程水平(biological processes,BP)、细胞组分水平(cellular components,CC)、分子功能水平(molecular functions,MF)3个维度。KEGG是一个整合了基因组、化学和系统功能信息的综合数据库,被广泛用于基因通路的富集注释。GO、KEGG分析均以P0.05为筛选标准,P值矫正方法为Benjamini-Hochberg法。4.蛋白质-蛋白质互作(protein-protein interaction networks,PPI)网络分析:利用STRING 11.5数据库20 分析DEG之间的潜在相互关系,以中等置信度score 0.4为标准构建PPI关系,并将结果导入Cytoscape(版本号3.9.1、Java 11.0.6)进行网络图构建,使用CytoHubba插件21进行关键(Hub)基因的筛选。5.诊断价值评估:为进一步探索关键基因在MDD中的诊断价值,采用pROC包(版本号1.18.0、R 4.2.1)进 行 受 试 者 工 作 特 征(receiver operating characteristic,ROC)分析和曲线下面积(area