基于
GEO
基因芯片
数据
差异
表达
基因
生物
信息学
分析
韩伟佳
基金项目:南方医科大学深圳医院科研基金(PY2021YM04);北京肝胆相照公益基金会资助项目(RGGJJ-2021-029)第一作者简介:韩伟佳,博士,研究方向:慢性肝脏疾病的基础与临床。E-mail:424032105 通讯作者:于海涛,硕士,副主任医师,副教授,研究方向:终末期肝脏的基础与临床。E-mail:2507011976 doi:10.3969/j.issn.1006-5709.2023.01.017基于 GEO 基因芯片数据集的肝性脑病差异表达基因生物信息学分析韩伟佳1,孙颖2,张鹏3,于海涛31.南方医科大学深圳医院消化内科 整合微生态诊疗中心,广东 深圳 518100;2.青岛市第八人民医院消化科;3.青岛市市立医院重症监护室【摘要】目的探索肝性脑病(hepatic encephalopathy,HE)的神经功能损伤的靶点基因以及基因的调控网络,为未来研究 HE 脑组织损伤的机制提供新思路。方法检索 GEO 数据库,应用生物信息技术分析方法,筛选差异表达基因(differentially expressed genes,DEGs),分析调控 DEGs 的非编码 RNAs 和调控因子。结果GEO 数据库中,GSE41919 和 GSE57193 这两个数据集符合本研究。两个数据集均提示,HE 患者存在诸多 DEGs。其中,ADORA3 等 18 个上调 DEGs 在两个数据集中均具有特异性。GO 富集和KEGG 富集提示,ADORA3 等 18 个 DEGs 与机体的免疫反应和炎症反应密切相关。调控因子和 miRNA 在调控 ADORA3 等 18 个DEGs 中发挥着重要的作用,其中,STAT3 家族对于与炎症反应相关和免疫反应相关的 DEGs 均具有调控作用;miR-137 这一与认知功能密切相关的 miRNA,也表现出与 DEGs 的密切相关性。结论HE 中的 DEGs 与疾病的发生发展相关,生物信息学技术的方法为更深入研究 HE 的发病机制和治疗靶点提供新的思路。【关键词】肝性脑病;差异基因;调控网络中图分类号:R575文献标识码:A文章编号:1006-5709(2023)01-0077-08收稿日期:2021-09-17Key differentially expressed genes and regulatory networks analysis in hepatic en-cephalopathy based on GEO datasetsHAN Weijia1,SUN Ying2,ZHANG Peng3,YU Haitao31.Department of Gastroenterology,Integrated Clinical Microecology Center,Shenzhen Hospital,Southern Medical Uni-versity,Shenzhen 518100;2.Department of Gastroenterology,Qingdao Eighth Peoples Hospital;3.Intensive Care Unit,Qingdao Municipal Hospital,China【Abstract】ObjectiveTo explore the mechanisms of hepatic encephalopathy(HE)by exploring the target genes and those regulatory networks.Methods We searched GEO database and screened differentially expressed genes(DEGs)through bioinformatics analysis.Then,we analyzed the non-coding RNAs and regulatory factors of DEGs.ResultsGEO database showed that two datasets,GSE41919 and GSE57193,were consistent with this study.Both datasets suggested that there were many DEGs in HE patients,among which 18 up-regulated DEGs such as ADORA3 showed specificity in both datasets.GO and KEGG enrichment showed that the 18 DEGs,including ADORA3,were closely related to immune response and inflammatory response.Regulatory factors and miRNA played important roles in regulating DEGs.Among them,the STAT3 family showed regulatory effects on DEGs related to both inflammatory and immune responses.miR-137,which was closely related to cognitive function,also showed a close correlation with DEGs.ConclusionDEGs in HE are related to the development of disease.Bioinformatics techniques provide new ideas for further study of the mechanisms of HE.【Key words】Hepatic encephalopathy;Differentially expressed genes;Regulated network肝性脑病(hepatic encephalopathy,HE)以认知障碍和意识改变为特征,是终末期肝脏疾病的常见并发症之一,重症 HE 患者可发生昏迷甚至死亡。HE 的发病机制十分复杂,分析神经功能损伤的调控基因网络,有助于探索脑组织细胞发生损伤的机制1-2。近年来,随着基因测序和微阵列分析技术的发展,科学家已在诸多神经退行性疾病3-4(如老年痴呆症)中探索基因调控网络。2013 年,Grg 等5通过分析基因测序序列的方式首次证实,HE 患者的 1 000 多个基因发生改变,这些基因的改变与小胶质细胞激活、氧化应激、炎症通路、受体信号、凋亡和细胞增殖有关。77胃肠病学和肝病学杂志2023 年 1 月第 32 卷第 1 期Chin J Gastroenterol Hepatol,Jan 2023,Vol.32,No.1随着生物信息技术的发展,整合分析多个数据库的测序基因,有助于探索更具有特异性的差异基因(differentially expressed genes,DEGs)的调控网络和生物学意义。本研究中,我们检索 GEO 数据库(https:/www.ncbi.nlm.nih.gov/geo),筛选 DEGs。在此基础上,应用生物信息技术分析方法,探索 DEGs 的功能富集和基因调控,旨在为进一步探索 HE 的机制提供新的思路。1资料与方法1.1检索 GEO 数据库及筛选 DEGsGEO 数据库中获取 HE 患者转录组分析相关的数据集,通过 GEO2R(https:/www.ncbi.nlm.nih.gov/geo/geo2r/)对 GEO 数据库获得的 DEGs 进行分析。以 P2为临界值,判断差异是否具有统计学意义。Venny(ht-tps:/b.csic.es/tools/venny/index.html)用于获取数据集的 DEGs 的交集,HemI 软件用于绘制热图。1.2GO 富集和 KEGG 富集DAVID(https:/da-vid.ncifcrf.gov/)6数据库对 DEGs 进行富集(GO 和KEGG)分析。以 P0.05 为临界值,判断差异是否具有统 计 学 意 义。GO 富 集 包 括 分 子 功 能(molecular function)、生物过 程(biological process)和细胞组成(cellular component)三个部分。1.3分析调控 DEGs 的非编码 RNAsTargetScan(http:/www.targetscan.org/vert_70/)数据库分析调节 DEGs 的 miRNA,以 a cumulative weighted context+score3 为临界值来筛选更具有特异性的DEGs。结果提示,共有 ADORA3 等 18 个 DEGs 更具有特异性(见表 1)。热图分析也提示,这 18 个 DGEs在 HE 患者和非 HE 患者之间存在显著差异(见图 2)。2.2DEGs 富集分析为了进一步了解 ADORA3 等18 个 DEGs 的功能,我们在 DAVID 数据集上进行了GO 富集分析和 KEGG 富集分析。GO 富集分析中,免疫应答、炎症应答、白三烯的代谢、生物合成等 10 项生物过程在 HE 与非 HE 患者中差异有统计学意义(P0.01);补体成分 C1 配体、胶原三聚体、质膜等 9 项细胞组成在 HE 与非 HE 患者中差异有统计学意义(P0.01);Toll 样受体结合、IgG 结合、丝氨酸型内肽酶活性 3 项分子功能在 HE 与非 HE 患者中差异有统计学意义(P2 和 P3 作为临界值。筛选出两组关于 HE 的 DEGs 的数据集。通过对两组 数 据 集 的 DEGs 取 交 集,我 们 发 现,ADORA3、LOX5AP、C1QA、C1QB、C1QC、CCR1、FCGR1B、FCGR3A、FPR1、HLA-DQA1、RBM47、RGS1、RNASE2、SERPINA3、SIGLEC14、SYK、TLR2、VSIG4 18 个上调的DEGs 在 HE 中更具有特异性。在脑内,炎症反应是导致神经元功能异常的原因,炎症反应会导致脑星形细胞肿胀,脑内细胞水肿,加速神经元细胞凋亡,进而影响脑功能5。而 HE 明显导致星形细胞和胶质细胞的炎症反应。有研究发现,HE的炎症反应升高会激活 Zn2t-dependent 基因转录和亚硝化应激,进而金属硫蛋白 mRNA 增加,导致星形细胞肿胀16。也有研究发现,HE 患者的肝脏代谢功能受损,促炎因子(如 IL-2 等)水平增加,进而与脑内的受体结合,导致小胶质细胞激活,激活的小胶质细胞反过来会促进肝脏炎症反应,进而影响患者的认知和睡眠觉醒状态17-19。此外,炎症因子也会加重 HE 患者的感染风险,导致 HE 病情进展17-19。在本次研究中,通过 GO 和 KEGG 功能富集分析,我们发现,HE 的DEGs 明显富 集 于 炎 症 反 应 和 感 染。HEN1 等 5 个DEGs 与炎症反应显著相关;SYK、TLR2 和 ALOX5AP 等 3 个 DEGs 与白三烯生物合成显著相关。在脑内,免疫反应也是导致神经元功能异常的原因,免疫反应所导致的小胶质细胞活化,也是导致 HE 发生发展的不利因素。有研究发现,HE 患者中亚型 CD4+T 细胞和 CD4+B 细胞的激活增加,小胶质细胞激活也会导致促炎因子 CX3CL1 和 IL-15 水平的增加20-21。而我们同样发现,HE 的 DEGs 明显富集于免疫反应,RGS1 等9 个 DEGs 与免疫反应也显著相关。在 HE 中,包括 STAT3 在内的 14 种转录调控因子的表达水平均升高,STAT 家族在细胞增殖、分化、血管生成等生理过程的调控中发挥着重要的作用,能够促进促炎因子诱导的细胞凋亡作用,也可在免疫反