温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于
GEO
数据库
酒精
依赖
差异
表达
基因
生物
信息学
分析
李幼东
国际精神病学杂志 JOURNAL OF INTERNATIONAL PSYCHIATRY 2023 年第50卷第3期-413-荟萃分析Meta analysis基于 GEO数据库的酒精依赖患者差异表达基因生物信息学分析李幼东、刘政、刘淙淙、彭雨涵、王紫妍 邓屹杉、李航、周婉玉、武育颖、刘久楹、常世宁【摘要】目的通过对酒精依赖患者基因数据集进行生物信息学分析,探索酒精依赖发生发展的分子标志物。方法从基因表达数据库(GEO)下载 GSE62699 表达数据集,包括 18 例酒精依赖患者及 18 例健康人群的伏隔核组织样本。使用 R 软件筛选出差异表达基因,之后对差异表达基因进行功能注释,包括基因本体论(GO)和京都基因和基因组百科全书(KEGG)通路富集分析。利用STRING 数据库构建蛋白互作(PPI)网络并进行分析,使用CytoHubba 插件筛选核心基因。最后对所得到的核心基因进行验证。结果在酒精依赖患者和健康人群之间,共分析得到 236 个差异表达基因,包括 131 个上调基因 105 个下调基因。应用 CytoHubba 插件共得到 11 个核心基因。通过验证获得4 个分子标志物。结论谷氨酸脱羧酶 2(GAD2)、基质金属蛋白酶抑制剂 1(TIMP1)、胆囊收缩素(CCK)、突触体相关蛋白(SNAP25)、内皮素1(EDN1)可能在酒精依赖的发生发展中发挥作用。【关键词】酒精依赖;GEO 数据库;生物信息学【中图分类号】R749【文献标识码】A【文章编号】1673-2952(2023)03-0413-05Bioinformatics analysis of differentially expressed genes in alcohol-dependent patients based on GEO database LI Youdong,LIU Zheng,LIU Congcong,et al.Department of Clinical Psychology,the First Hospital of Hebei Medical University,Hebei Key Laboratory of Brain Science and Psychiatric Psycholigic Disease,Shijiazhuang 050000,China【Abstract】ObjectiveTo explore the molecular markers for the development of alcohol dependence by bioinfor-matics analysis of gene data set of patients with alcohol dependence.MethodsThe GSE62699 expression dataset was downloaded from the Gene Expression Database(GEO),including nucleus accumbens tissue samples from 18 alcohol-dependent patients and 18 healthy subjects.R software was used to screen out differentially expressed genes,and then the differentially expressed genes were functionally annotated,including Gene Ontology(GO)and Kyoto Encyclopedia of Genes and Genomes(KEGG)pathway enrichment analysis.The STRING database was used to construct and analyze the protein interaction(PPI)network,and CytoHubba was used to screen the core genes.Finally,the core genes ob-tained were verified.ResultsA total of 236 differentially expressed genes,including 131 up-regulated genes and 105 down-regulated genes,were analyzed between patients with alcohol dependence and healthy subjects.A total of 11 core genes were obtained by CytoHubba.Four molecular markers were obtained by validation.ConclusionGlutamic acid decarboxylase 2(GAD2),matrix metalloproteinase inhibitor 1(TIMP1),cholecystokinin(CCK),synaptosome as-sociated protein(SNAP25)and endothelin1(EDN1)may play a role in the development of alcohol dependence.【Key words】Alcohol dependence;GEO;Bioinformatics基金项目 2021 年度河北省社会科学发展研究课题(编号:20210201321)。作者工作单位 河北医科大学第一医院临床心理科,河北省脑科学与精神心理疾病重点实验室(石家庄,050000)。第一作者简介 李幼东(1966.01-),女,河北石家庄人,硕士,主任医师,研究方向:临床心理。通讯作者 李幼东(Email:)。酒精依赖是一种慢性易复发性脑病,主要特征是无法控制的强烈渴求饮酒行为,并在没有酒精的情况下出现酒精戒断综合征。据世界卫生组织统计,酒精依赖的年患病率高达 4,并且每年约有 300 万人死于酒精依赖1。酒精依赖主要由长期过量饮酒造成,发病机制复杂且未完全阐明2,近年来遗传因素受到更多的重视,主要包括基因、基因表达、酶及分子通路等。生物信息学分析是随着人类基因荟萃分析Meta analyseDOI:10.13479/ki.jip.2023.03.026国际精神病学杂志 JOURNAL OF INTERNATIONAL PSYCHIATRY 2023 年第50卷第3期-414-荟萃分析Meta analysis组计划的启动所产生的新兴研究方法,它在探索核心基因和生物学通路方面具有强大的优势,已逐渐成为探索包括抑郁症、精神分裂症及双相障碍在内的复杂精神疾病发病机制的有效方法。最近有研究通过生物信息学分析发现丝氨酸蛋白酶抑制因子 A类 3 可能参与酒精依赖的发生。然而,迄今为止,在酒精依赖上仅进行了有限的生物信息学分析及发病机制探索。因此,为了更好的研究酒精依赖发生发展的机制,本研究使用 GSE62699 表达数据集,通过基因本体论(GO)、基因组百科全书(KEGG)富集分析、蛋白互作(PPI)网络构建以及 CytoHubba 插件的分析来探索酒精依赖发生发展中的分子标志物。1资料与方法 1.1资料来源本研究以“alcohol dependence”为检索词,通过基因表达数据库(GEO)进行搜索和筛选,选择出编号为 GSE62699 的表达数据集。该数据集基于GPL571 平台检测,包含 18 例酒精依赖患者伏隔核组织样本及 18 例健康人群伏隔核组织样本。验证数据集选择编号为 GSE29555 的表达数据集,该数据集基于 GPL6947 平台检测,包含 68 例酒精依赖患者及60例非酒精依赖患者的样本。1.2方法1.2.1差异表达基因筛选及可视化使用 R 软件平台“Limma”包对酒精依赖患者及健康人群基因表达数据集进行数据处理,以|LogFC|1 及 P0 05 为阈值标准筛选酒精依赖患者与健康人群的差异表达基因。1.2.2功能富集分析使用 R 软件平台对所有差异表达基因进行KEGG 通路富集分析和 GO 功能富集分析来寻找差异表达基因所映射的生物学通路和生物学功能。以 p.adjust0.05具有统计学意义。1.2.3蛋白互相作用网络分析将先前筛选得到的差异表达基因输入到在线搜索工具STRING数据库中,利用该数据库获得PPI网络。1.2.4核心基因筛选将获得的 PPI 网络导入 Cytoscape3.8.2 进行可视化分析,通过使用 CytoHubba 插件的三种不同算法(betweenness、closeness、degree)计算出评分位于前 20 位的基因,之后将这 20 位基因取交集获得核心基因。1.2.5核心基因验证以“alcohol dependence”为关键词选择GSE29555表达数据集,下载核心基因在酒精依赖患者和非酒精依赖患者的表达数据集,利用 R 软件平台绘制表达箱线图,验证核心基因在酒精依赖中的表达情况。1.2.6酒精依赖的生物标志物的评估我们期待关键基因能够对酒精依赖的发生发展提供帮助,因此基于 R 软件平台进行了受试者工作特征(ROC)曲线分析。获得曲线后通过计算曲线下的面积(AUC)值对酒精依赖的生物标志物进行评估,其中 AUC 值越接近 1.0 则说明准确性越高,等于 0.5 时则准确性最低。2结果2.1差异基因筛选由GSE62699表达数据集分析可得,相对于健康人群,酒精依赖患者可筛选得到 236 个差异表达基因,其中表达上调的基因数目有 131 个,表达下调的基因数目有 105个。可视化结果如图 1。图1酒精依赖与健康人群差异表达基因火山图2.2功能富集分析为了更好的解释差异表达基因的生物学功能,我们使用 R 软件对它们进行了 GO 和 KEGG 富集分析。上调的基因总共富集了 273 个 GO-生物过程(BP),19 个GO-细胞组分(CC),15个 GO-分子功能(MF)和 23条 KEGG 通路。上调的差异基因主要富集在生长因子结合、胰岛素样生长因子结合等分子功能,血液微粒及分泌颗粒腔等细胞组分,对皮质类固醇的反应、对糖皮质激素的反应等生物学过程,以及白细胞介素-17(IL-17)信号通路、肿瘤坏死因子(TNF)信号通路等通路。下调的基因总共富集 60 个 GO-BP,54 个 GO-CC,18 个 GO-MF 和7 条 KEGG 通路。下调的差异基因主要富集在体门控阴离子通道活性及磷脂受体结合等分子功能,突国际精神病学杂志 JOURNAL OF INTERNATIONAL PSYCHIATRY 2023 年第50卷第3期-415-荟萃分析Meta analysis集,共筛选出 11 个核心基因(如图 5、6、7),分别是谷氨酸脱羧酶 2(GAD2)、趋化因子 8(CXCL8)、血管性血友病因子(VWF)、基质金属蛋白酶抑制剂1(TIMP1)、胆囊收缩素(CCK)、突触体相关蛋白(SNAP25)、结缔组织生长因子(CTGF)、内皮素 1(EDN1)、I 型跨膜糖蛋白(CD44)、转录因子Fos和转录因子Jun。图5PPI网络图2.4核心基因验证基于 GSE29555 表达数据集分析 11 个关键基因在酒精依赖患者中的表达趋势,结果显示 GAD2、TIMP1、CCK、SNAP25、EDN1 与 GSE62699 表达数据集表达趋势一致(如图 8)。2.5酒精依赖分子标志物的评估整理后的 5 个核心基因的表达量导入 R 软件中,用于评估核心基因在酒精依赖中的价值。由 ROC 曲线可知,GAD2、TIMP1、SNAP25、EDN1 的 AUC 均大于 0.7,说明 GAD2 等 4 个基因可能在酒精依赖发生发展中起着重要作用。