分享
基于生物信息学分析筛选胰腺癌差异表达基因_李威倩.pdf
下载文档

ID:2254957

大小:1.95MB

页数:7页

格式:PDF

时间:2023-05-04

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 生物 信息学 分析 筛选 胰腺癌 差异 表达 基因 李威倩
基金项目云南省地方本科高校基础研究联合专项资金项目(202101BA070001-112;202001BA070001-191);云南省基础研究计划项目(202101AT070017);云南省教育厅科学研究基金项目(2022Y813)收稿日期2022-04-29修回日期2022-06-21第一作者简介李威倩,硕士研究生,主要从事胰腺疾病、糖尿病及其并发症研究。*通信作者:Yu Xin,教授,博士,E-mail:。胰腺癌是发生于消化系统中恶性程度最高的肿瘤1。目前胰腺癌已成为全球第 12 位常见的恶性肿瘤,是全球癌症病死的第 7 大原因,也是中国第6 大癌症病死原因2。预计在未来 30 年内胰腺癌将成为美国癌症病死的第 2 大原因3,欧洲与癌症相关的第 3 大病死原因4。因此,胰腺癌被称为“癌症之王”1,5。根治性手术治疗是目前唯一有效的治疗方法,但由于胰腺癌发病隐匿,早期难以确诊,超过 80%的患者确诊时已是晚期,手术治疗效果不佳6。即使对早期胰腺癌患者可行根治性手术并辅以放化疗和靶向治疗,但大多数患者术后存在局部复发和转移,术后 5 年生存率仍不足 10%7-8。因此,有必要探索新的方法提高胰腺癌早期诊断率和改善患者的生存及预后。目前,国内外研究人员逐渐把研究重点放到了分子靶向治疗方向,寻找有效的生物标志物既有助于提高胰腺癌的早期诊断率,又有利于探索新的胰腺癌治疗靶点,从而提供新的治疗思路。随着高通量基因组技术和基因芯片技术的兴起,使针对胰腺癌研究的二次分析成为可能。其中,基因表达综合(gene expression omnibus,GEO)数据库(https:/www.ncbi.nlm.nih.gov/geo/)收录了各国研究人员及机构提交的基因表达数据,主要包括基因芯片、高通量测序数据,研究者可以在 GEO 数据库搜索已发表的论文中涉及基因表达检测的数据。本研究旨在利用生物信息学方法对 GEO 数据库中的胰腺癌基因芯片数据集进行分析,挖掘胰腺癌的差异表达基因(differentially expressed genes,DEGs),并针对DEGs 在人胰腺癌及癌旁组织中的表达水平进行研究,为探索胰腺癌的发病机制和潜在的治疗靶点提供新的线索和依据。1材料与方法1.1数据资料检索与收集以“pancreatic cancer”或“pancreatic adenocarcinoma”为关键词,在 GEO 数据库中进行检索。纳入标准:种属“Homo sapiens”;基于生物信息学分析筛选胰腺癌差异表达基因李威倩1,陈奕明2,张文婷1,苏莹珍3,帅红艳1,Yu Xin1*(1.大理大学基础医学院,云南大理671000;2.大理大学临床医学院,云南大理671000;3.昆明学院医学院,昆明650214)摘要目的:利用生物信息学对 GEO 数据库信息进行分析,探索胰腺癌发生、发展的关键基因及信号通路。方法:下载胰腺癌基因表达谱芯片 GSE107610,利用 R 语言对差异表达基因进行统计分析,研究相关生物学过程、信号通路和蛋白质相互作用关系;利用 Cytoscape 软件构建蛋白质-蛋白质相互作用网络图,利用苏木精-伊红染色验证样本差异性,实时荧光定量聚合酶链反应对筛选出的 4 个核心基因进行验证。结果:71 个差异基因中上调基因 17 个,下调基因 54 个。这些基因主要参与蛋白质水解、酒精代谢、外源性代谢、消化、免疫系统的调节等过程。核心基因在 mRNA 水平的表达和 GEO 数据库分析结果一致。结论:利用生物信息学技术成功挖掘到与胰腺癌发生、发展相关的差异表达基因,经验证上述差异基因在人胰腺癌组织中的表达水平变化一致,为确定胰腺癌的早期诊断标志物与治疗靶点提供了新的思路。关键词胰腺癌;生物信息学;GEO 数据库;差异表达基因中图分类号R736.7文献标志码A文章编号2096-2266(2023)02-0024-07DOI10.3969/j.issn.2096-2266.2023.02.004大理大学学报JOURNAL OF DALI UNIVERSITY第8卷第2期2023年2月Vol.8No.2Feb.2023241.5统计分析采用 GraphPad Prism 8.0 软件对数据进行统计分析,两样本均数的比较采用独立样本t 检验,P0.05 为差异有统计学意义。2结果2.1DEGs 的筛选对 GEO 数据库中的数据进行二次分析,筛选出与胰腺癌相关联的潜在分子靶点。对从 GEO 数据库获得的 GSE107610 数据集进行数据分析,筛选该数据集中差异表达水平超过 2倍且校正后 P0.05 的基因进行后续研究,其中上调基因 17 个,下调基因 54 个。见表 2。2.2GO 分析与 KEGG 通路富集分析GO 分析主要包括 3 个方面:分子功能、细胞组成和生物过程,分别描述了基因产物可能行使的分子功能、所处的细胞环境以及参与的生物过程。KEGG 通路富集分析从分子水平对基因参与的高级功能和信号通路进行分析。GO 分析和 KEGG 通路富集分析将微观的 DEGs 总结为宏观的功能信息,揭示基因及其功能的关系。GO 分析结果表明,在分子功能方面,DEGs 主要集中在调控乙醇脱氢酶、转运蛋白、视黄醇结合蛋白等的活性;在细胞组成方面,DEGs 主要表达在细胞外间隙、血小板 颗粒,参与刷状缘膜、细胞膜的组成成分;在生物过程方面,DEGs 主要参与蛋白质水解、酒精代谢、外源性代谢、消化、免疫同时具备肿瘤组织与配对正常组织。经过检索后选择平台 GPL15207 上的数据集 GSE107610。该数据集中包含胰腺癌组织样本 39 例(GSM2872497GSM2872551),正常组织样本 2 例(GSM2872552GSM2872553)。1.2DEGs 的确定对数据集 GSE107610 中的矩阵数据进行筛选,选取其中的基因 ID 号及基因表达水平。利用 R 语言中的“Limma”软件包对上述数据进行分析以确定数据集中的 DEGs,设定筛选条件为 P1。1.3DEGs 的生物信息学分析利用 R 语言,对筛选出的 DEGs 进行 GO 分析和 KEGG 通路富集分析。在 STRING 数据库(http:/www.string-db.org)中导入 DEGs 进行分析,寻找 DEGs 对应的蛋白质之间可能存在的相互作用关系,构建蛋白质-蛋白质相互作用(protein-protein interaction,PPI)网络。将靶蛋白文件导入 Cytoscape 软件,应用“cytohubba”软件包计算出 PPI 网络中前 15 个连通性较高的蛋白质,其对应的基因为核心基因。1.4核心基因表达验证经患者知情同意,选取在大理大学第一附属医院行胰腺癌切除术的胰腺癌患者的肿瘤组织及癌旁组织各 3 例。为确认癌组织和癌旁组织的病理差异,取部分样本,在 4%甲醛固定液中固定 24 h,流水冲洗 30 min,脱水透明、石蜡包埋、4 m 连续切片,经苏木精-伊红染色(hematoxylin and eosin staining,HE 染色)后在光学显微镜下观察组织病理表现。筛选出 4 个核心基因,通过实时荧光定量聚合酶链反应(polymerase chain reaction,PCR)检测核心基因在胰腺癌组织及癌旁组织中 mRNA 的表达。取部分组织样本,使用 FastPure Cell/Tissue TotalRNA Isolation 试剂盒(Vazyme 公司)提取癌组织及癌旁组织中的总 RNA,采用逆转录试剂盒(Vazyme公司)进行逆转录并进行实时荧光定量 PCR 实验,荧光试剂采用 ChamQ Universal SYBR qPCR MasterMix(Vazyme 公司),反应条件:95 10 s,60 30 s。引物序列见表 1。表 1实时荧光定量 PCR 引物序列基因名称正向引物反向引物GAPDH5 TCAAGGCTGAGAACGGGAAG 35 TCGCCCCACTTGATTTTGGA 3CPA25GCCCTTTTTGGGCATATCTACT 35CTGCCTGGACGTTGACGAA 3CELA35GGTGTTGGGTGAGTACAACCT 35AGCAGTGCTTATAGTCCACCA 3ACE25CAAGAGCAAACGGTTGAACAC 35CCAGAGCCTCTCATTGTAGTCT 3ANPEP5CACACACCGTTCCTGGATCT 35AACAGGCAGACTGGGCAAAA 3李威倩,陈奕明,张文婷,等基于生物信息学分析筛选胰腺癌差异表达基因总第 86 期第 8 卷25应答的调节等生物学过程。见表 3。表 3DEGs 的 GO 分析结果KEGG 通路富集分析显示,DEGs 主要参与的信号通路为蛋白质的消化和吸收、细胞色素 P450参与的药物和外源性物质代谢、化学致癌作用、谷胱甘肽代谢、视黄醇代谢等。见表 4。2.3PPI 网络的构建与分析将 DEGs 上传至STRING 数据库构建 PPI 网络图。PPI 网络共包含68 个节点和 142 个连接,将获得的分析数据按综合分数 0.15 进行筛选后下载。见图 1A。把数据导入Cytoscape 中后通过 cytohubba 插件获得连接度最高的前 15 个核心基因:OTC,ACE2,SLC26A3,RBP2,SLC10A2,MEP1B,CES2,CYP3A4,GSTA2,ADH4,CPA2,ADH1A,CELA3A,REG1B,ANPEP。见图1B。2.4核心基因表达验证选取临床患者部分胰腺癌组织与癌旁组织样本进行 HE 染色,在光学显微镜下观察,胰腺癌组织样本较癌旁组织样本不规则腺体明显增多,细胞异型性显著。见图 2AB。选择 CPA2、ANPEP、ACE2、CELA3A 4 个核心基因,用实时荧光定量 PCR 对胰腺癌组织及癌旁组织中的 mRNA 表达水平进行检测,结果表明在胰腺癌组织中,CPA2、ANPEP 较癌旁组织显著降低,差异有统计学意义(P0.01)。见图 3AB。CELA3A、ACE2 基因中 mRNA 表达水平在胰腺癌组织的表达较癌旁组织明显增高,差异有统计学意义(P0.05)。见图 3CD。3讨论胰腺癌是高度恶性的消化系统肿瘤,发病隐蔽,临床治疗效果不佳,5 年生存率低,预后极差9。胰腺癌的发病机制和如何改善患者预后依旧是临床及基础研究领域尚未攻克的难题。本研究通过生物信息学方法探索在胰腺癌的发生、发展中发挥重要作用的核心基因,为发现潜在治疗胰腺癌的靶点KEGG 通路GO-IDP蛋白质的消化和吸收hsa049740.01细胞色素 P450 参与的药物代谢hsa009820.01化学致癌作用hsa052040.01谷胱甘肽代谢hsa004800.02细胞色素 P450 参与的外源性物质代谢hsa009800.01视黄醇代谢hsa008300.03表 2胰腺癌差异表达基因的筛选基因DEGs 名称上调基因SLC25A12,EMB&EMBP1,RASA3,SLCO3A1,HOXC6,DNAJA4,MDC1,PITX1,NIN,C9orf167,TACC3,TPBG,MBOAT2,KIF4A&KIF4B,HDAC4,CDT1,RBMS1下调基因IL33,ANPEP,XRCC4,C17orf78,REG1B,CYP3A4,FOLR1,SLC5A9,TRPV6,SULT1B1,PLA2G7,ADH4,SLC26A3,RNF186,PPBP,SLC39A5,NEFL,ORM1&ORM2,RBP2,SLIT3,ZNF626,KLK5,CPA2,GSTA2,SLC10A2,PIWIL2,OTC,APOBEC2,CRISP3,ACE2,GKN,CCDC68,SLC7A9,RASL11A,MEP1B,CELA3A,GGT6,DPP10,LUM,ADH1A,C17orf48,RWDD2A,PBLD,SLC46A3,KLHDC2,DUOXA2,HIBAD,POU2

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开